Программа курсов Machine Learning Pro + Deep Learning

Онлайн
из любой точки мира
{{start_date}}
дата старта
20 недель
длительность курса
Самая востребованная технология искусственного интеллекта
Machine Learning vs Deep Learning - в чем разница?! Как подобрать нужный алгоритм?
"Потрогаем руками" все алгоритмы и разберемся на практике - где нужны Нейронные сети, а где достаточно классических алгоритмов. Комплексный подход, организованный в бандле "Machine Learning Pro + Deep Learning", подойдет для тех, кто хочет прокачаться в программировании глубоких нейронных сетей и моделей машинного обучения. Прохождение курсов потребует базового знания языка Python. В процессе обучения вы освоите все классические алгоритмы Машинного обучения,от деревьев до рекомендательных систем, а также научитесь создавать различные нейронные сети. Вас ждут хакатоны и in class соревнования на kaggle!
Программа курса «Machine Learning PRO»
Модуль 1
Модуль 1
Введение в машинное обучение
Введение в машинное обучение. Типы алгоритмов
Какие бизнес-задачи решает машинное обучение и какие нет
Обзор кейсов по внедрению машинного обучения: анализ алгоритмов и использованных решений
Этапы решения задач машинного обучения:
  • Определение требований
  • Предобработка данных
  • Моделирование (обучение модели)
  • Тестирование
  • Внедрение
Задачи на закрепление темы: тесты, проверка кода
Практика: реализация этапов машинного обучения на примере готовой модели
Модуль 2
Модуль 2
Методы предобработки данных
Типы данных и их проблемы
  • Типы данных: табличные, текстовые, временные ряды, аудиосигналы, изображения, видео и другие
  • Проблемы с данными: пропуски, неподходящий формат, мусор в данных, зашифрованные данные, проблема с разметкой и прочее
Работа с пропусками и начальная обработка
  • Работа с пропусками и дублями
  • Заполнение статистиками
  • Нормализация данных по min, max, std
  • Удаление столбцов и строк
  • Проверка правильности типа данных
Визуализация для предобработки
  • Гистограмма
  • Correlation plot
Feature engineering
  • Создание признаков вручную
  • Полиномиальные признаки
  • Dummy-переменные
  • Признаки даты и времени
  • Статистики по наборам признаков
— Поиск выбросов
  • Поиск и удаление по порогу
  • Поиск по отклонению / распределению
  • Interquartile range
  • DBSCAN
Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
Практика: работа с параметрами модели
    Модуль 3
    Модуль 3
    Регрессия
    Линейная регрессия. Задачи регрессии и примеры использования в бизнесе
    Математический вывод линейной регрессии. Возможные ошибки в работе алгоритма
    Обучение модели линейной регрессии
    Методы нахождения прямой в регрессии
    • Аналитический вывод для одной переменной
    • Аналитический вывод для многих переменных
    • Градиентный спуск
    Логистическая регрессия
    • Примеры использования в решении жизненных задач
    • Решение задачи с помощью градиентного спуска
    • Обучение модели логистической регрессии
    Регуляризация моделей
    • L1-регуляризация
    • L2-регуляризация
    Дополнительные материалы
    • Коэффициент детерминации
    • Сравнение производительности разных методов
    • Использование матричных операций
    • Преобразование линейной модели
    Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
    Практика: обучение и оптимизация моделей линейной и логистической регрессии
    Модуль 4
    Модуль 4
    Кластеризация
    Обучение с учителем и без учителя (supervised / unsupervised learning)
    Области применения методов обучения без учителя
    Метод K-means
    • теория метода и реализация в коде
    • плюсы и минусы метода
    • настройка параметров
    Метод mean-shift
    • теория метода и реализация в коде
    • границы применимости
    Метод понижения размерности с помощью SVD
    • теория метода и реализация в коде
    • сильные и слабые стороны
    Работа с текстами
    • кластеризация текстов: теория и реализация в коде
    • метод "мешок слов"
    Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
    Практика: unsupervised обучение модели методами K-means, mean-shift и методом понижения размерности
    Модуль 5
    Модуль 5
    Tree-based алгоритмы: введение в деревья решений
    — Введение в деревья решений
    — Решающее дерево и как его построить
    • Структура дерева: внутренние и терминальные узлы
    • Разделяющие функции. Виды разделяющих функций
    • Обучение дерева решений для классификации и регрессии
    • Критерии качества разделения и прекращения роста дерева
    • Влияние параметров обучения на under / overfitting модели
    Примеры использования деревьев решений в production
    — Визуализация структуры дерева
    Алгоритм построения дерева
    Виды деревьев в библиотеках машинного обучения
    Реализация деревьев в библиотеке sklearn
    Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
    Практика: обучение решающего дерева для задачи регрессии
    Модуль 6
    Модуль 6
    Tree-based алгоритмы: ансамбли
    — Области применения ансамблей
    • Bagging и out-of-bag оценки
    • Применение bagging к логистической регрессии
    • Cлучайный лес: bagging и эвристики подбора признаков
    • Перебор параметров алгоритма по сетке (Grid Search)
    — Random Forest
    • Объединение деревьев в один классификатор
    • Как вырастить деревья разными?
    • Настраиваемые параметры случайного леса
    • Сравнение результатов настройки параметров
    • Анализ качества ансмабля и влияния признаков
    Бустинг
    • Что такое бустинг деревьев?
    • AdaBoost и примеры использования
    • Значение порядка построения деревьев в ансамбле
    • AdaBoost в логистической регрессии
    • Gradient Boosting
    • CatBoost: особенности интерфейса
    — Стекинг
    • Построение классификатора первого уровня и мета-классификатора
    Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
    Практика: соревнование по обучению решающих деревьев на kaggle
    Модуль 7
    Модуль 7
    Валидация данных и оценка качества алгоритмов
    — Методы разбиения выборки для валидации данных
    — Метрики качества алгоритмов
    • loss-функция
    • кросс-энтропия
    • метрики precision / recall
    • precision-recall curve
    • и другие
    — Оценка качества алгоритмов в production
    — Underfitting / overfitting
    • примеры реализации в коде
    • как избавиться от переобучения?
    — Дисбаланс выборки: как бороться
    — Визуализация процесса обучения модели
    • визуализация с Tensorboard
    • другие методы
    Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
    — Практика: оценка качества алгоритма классификации
    Модуль 8
    Модуль 8
    Временные ряды в машинном обучении
    — Задача анализа временных рядов в ML
    • области применения
    • метрики оценивания
    — Принципы обучения алгоритма
    • "оконные" функции
    • экспоненциальное сглаживание: простое, двойное, с ручной настройкой параметров
    • кросс-валидация на временных рядах
    — Эконометрический подход в анализе временных рядов
    • стационарность и единичные корни
    • дифференцирование
    • ограничения и недостатки эконометрического подхода
    — Алгоритмы машинного обучения для анализа временных рядов
    • извлечение признаков для обучения
    • обучение линейных моделей
    • применение регуляризации
    • бустинг для временных рядов: преимущества и ограничения
    Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
    — Практика: обучение линейной модели и использование XGBoost для анализа временных рядов
    Модуль 9
    Модуль 9
    Рекомендательные системы
    Обзор подходов к построению рекомендательных систем
    Принципы разбиения выборки
    Модель TopRecommender
    • принцип работы алгоритма
    • практика реализации в коде
    • границы применимости, достоинства и недостатки
    Коллаборативная фильтрация
    Разреженная матрица
    Алгоритм SVD Recommender
    • принцип работы алгоритма
    • практика реализации в коде
    • достоинства метода, ограничения
    Проблема холодного старта в рекомендательных системах
    Бустинг в рекомендательных системах: использование LightGBM
    Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе
    Практика: обучение рекомендательной системы
    Модуль 10
    Модуль 10
    Финальный хакатон
    Выпускной хакатон: командное соревнование по обучению модели на платформе kaggle
    Программа курса «Deep Learning»
    Модуль 1
    Модуль 1
    Введение в искусственные нейронные сети

    • Современное применение нейронных сетей. Основные задачи: компьютерное зрение, Natural Language Processing, Self-Driving Agents, GAN, Reinforcement Learning и другие области
    • Виды нейронных сетей: прямого распроcтранения, сверточные, рекуррентные, генеративные и другие архитектуры
    • Обучение нейронных сетей
    • Среда для работы: GoogleColab
    Практика:
    Сравниваем модели классического машинного обучения (линейную модель, boosting) и нейронную сеть прямого распространения для распознавания рукописных цифр датасета MNIST на Python

    Модуль 2
    Модуль 2
    Фреймворки для глубокого обучения (Keras, TensorFlow)
    • Введение в фреймворк TensorFlow
    • Графы вычислений
    • Операции с тензорами
    • Цепное правило
    • Оптимизация в TensorFlow
    • Логирование для TensorBoard
    • Работа с TensorFlow в Google.Colab
    Практика: Создаем модель распознавания изображений на базе датасета FashionMNIST и фреймворка Keras
    Модуль 3
    Модуль 3
    Сверточные нейронные сети
    • Введение в сверточные нейронные сети
    • Операция свертки
    • Простой сверточный слой
    • Усложнение сверточного слоя
    • Пулинг слой
    • Архитектура первой сверточной сети
    • Современные архитектуры
    • Inception V3
    Практика: Распознаем изображения в датасете CIFAR-10 с помощью сверточной нейронной сети
    Модуль 4
    Модуль 4
    Оптимизация нейронной сети
    • Пути оптимизации нейронной сети
    • Функции активации
    • Инициализация весов
    • Влияние learning rate на сходимость
    • Batch нормализация
    • Dropout регуляризация
    • Стохастический градиентный спуск
    • Adam: Adaptive Moment Estimation
    • Матричные операции
    Практика: Улучшаем скорость и производительность сетей для кейса предыдущего модуля
    Модуль 5
    Модуль 5
    Transfer learning & Fine-tuning

    • Transfer learning
    • Архитектура сети ImageNET
    • Оптимизация сети при помощи back propagation
    • Автокодировщики: понятия encoder и decoder
    • Архитектура автокодировщика
    Практика: Дообучение нейронной сети для решения задачи классификации изображений на kaggle
    Модуль 6
    Модуль 6
    Сегментация изображений
    • Практические применения сегментации
    • Классическая сегментация и сегментация на базе нейросетей
    • Методы улучшения производительности модели
    • Дилатационная свертка
    • Сегментация людей на датасете Microsoft COCO
    • Архитектура сети на базе Tensorflow и карта сегментации
    • Автоматическое сохранение снэпшотов
    • Post-processing сегментации
    Практика: Решение задачи сегментации изображений людей на kaggle
    Модуль 7
    Модуль 7
    Детектирование объектов
    • Введение в детектирование объектов
    • Задача локализации
    • Регрессия, классификация и локализация в детектировании объектов
    • Region proposals: selective search, edge boxes
    • Методы R-CNN и FAST R-CNN
    • Методы SSD / YOLO
    • Сравнение методов детекции
    Практика: Обучаем нейросеть решать задачу детекции на примере датасета с логотипами брендов
    Модуль 8
    Модуль 8
    Введение в NLP и Word Embeddings
    • Задачи Natural Language Processing (NLP)
    • Векторизация текстовых данных
    • Вхождение слова (Occurrence)
    • Метод TF-IDF
    • Применение сингулярного разложения (Singular Value Decomposition, SVD)
    • Метод Word-2-Vec. Оценка и обучение. Кластеризация и арифметика
    • Метод Co-occurrence
    • Emdeddings
    • Модели Skip-gram и CBOW
    • Subsampling, making batches, negative sampling
    Практика: Создаем нейросеть для работы с естественным языком и участвуем в соревновании на kaggle
    Модуль 9
    Модуль 9
    Рекуррентные нейросети
    • Сравнение сетей прямого распространения и рекуррентных нейросетей
    • Архитектура рекуррентной нейросети. Unfolding
    • Продвинутые рекурренты. LSTM (Long Short-Term Memory), GRU (Gated Recurrent Unit)
    • Обработки последовательностей: Many-to-One, One-to-Many, Many-to-Many
    • Many-to-One в классификации текстов, анализе временных рядов и отображении текста в картинку
    • One-to-Many в генерации текстов. Языковая модель
    • SEQ 2 SEQ: Encoder-Decoder
    • Механизм внимания (Attention). Вычисление весов. Отказ от рекуррентов
    • Архитектура TRANSFORMER
    • Практика классификации текстов с помощью рекуррентных нейросетей
    Практика: Создаем чат-бота на базе рекуррентной нейросети
    Модуль 10
    Модуль 10
    Reinforcement learning (обучение с подкреплением)
    • Классы задач: обучение с учителем, без учителя, обучение с подкреплением
    • Применение: игровые агенты, self-driving агенты, робототехника
    • Состояния, действия, награды
    • Понятие оптимальной политики
    • Оценка состояния и действий. Оптимальная Q-функция
    • Q-Learning. Уравнение Беллмана
    • Exploration vs. Exploitation: исследование и эксплуатация оптимальной стратегии
    • Deep Q-Learning (DQN)
    • Другие методы RL: Policy Gradients, Actor-Critiс
    Практика: Создаем агента для игры на основе DQN алгоритма.
    Модуль 11
    Модуль 11
    What's next?
    • Другие области применения нейронных сетей
    • Self-driving и AI
    • GAN: Generative Adversarial Networks
    • Перспективы развития области
    • Советы по профессиональному развитию
    Практика: Генерируем изображение с помощью GAN
    {{start_date}}
    дата старта
    Онлайн
    формат обучения
    20 недель
    длительность курса
    Среди наших студентов сотрудники компаний
    ЧТО ВЫ ПОЛУЧАЕТЕ
    О КУРСЕ
    Старт: 31 октярбя 2019
    Формат: Онлайн
    Продолжительность: 60 минут
    Стоимость: 29 990 ₽ 24 990 ₽
    Список преимуществ 1
    Список преимуществ 2
    Список преимуществ 3
    Список преимуществ 4
    Список преимуществ 5
    О КУРСЕ
    ЧТО ВЫ ПОЛУЧАЕТЕ:
    - Учебные каникулы
    - Доступ к курсу в течение года
    Старт:
    {{price_before}}Р
    {{price_new}}Р
    Скидка {{sale}}% при покупке до {{deadline}}!
    Можно в рассрочку.
    Формат: Онлайн
    СТОИМОСТЬ ОБУЧЕНИЯ:
    {{start_date}}
    - Помощь коллектива и преподавателя
    Длительность:
    20 недель
    Готовы учиться?
    Оставьте заявку в форме ниже - мы свяжемся с вами и обсудим все детали