Data Scientist с нуля в МГУ

Data Scientist
с нуля до PRO

Научитесь разрабатывать ML-модели
и обучать нейросети на практике
онлайн | 9 месяцев | старт 19 Сентября
#
Сможете искать работу после 9 месяцев обучения
#
Стажировка в компании «Моторика»
#
Подходит новичкам без опыта в IT
#
9 проектов
в портфолио

Курс разработан совместно
с академиком РАН из МГУ им. Ломоносова

Алексей Львович Семенов

Заведующий кафедрой математической логики
и теории алгоритмов МГУ
№1
среди российских вузов
по версии Times Higher Education World Reputation Rankings 2024 года
68%
работодателей доверяют качеству образования в МГУ
Участник разработок ПО для ИИ и суперкомпьютеров, лауреат премии ЮНЕСКО в области цифровых технологий в образовании и премии им. А. Н. Колмогорова за выдающиеся достижения в области математики
Топ-100
лучших университетов мира в области естественных наук в рейтинге QS World University Rankings by Subject 2024
[1]

Чем занимается Data Scientist, один из самых востребованных
IT-специалистов
2025 года

[2]
Обрабатывает большие объемы неструктурированной информации
и превращает ее в упорядоченный
набор данных
[3]
Строит и тестирует математические модели. Находит закономерности, дает прогнозы и предлагает лучшие решения в разных сферах
Например, дата-сайентист может оценить будущий спрос на товары и услуги, построить систему распознавания лиц, или разработать рекомендательную систему

Ваши навыки после обучения

Вы сможете:

Программировать на Python
Работать с API
Работать в одном из двух направлений — ML- или CV-инженерии
Конвертирование бизнес-задачи
в технические и наоборот
Обрабатывать данные
Создавать математических и ML-модели

Инструменты:

Airflow
Docker
Linux
Git
Pastgresql
mongodb
nosql
headoop
keras
plotly
matplotlib
Seaborn
Numpy
Pandas
Sql
python

Где и кем сможете работать после курса

Так выглядят вакансии, доступные младшим дата-сайентистам после обучения

Junior Data Scientist в области
разработки ИИ

Требования:
Знание языка Python, алгоритмов ML, математики и статистики
от 100 000 ₽

Junior Data Scientist

Требования:
Знание языка Python | Опыт работы с API | Знания алгоритмов ML, математики и статистики
от 90 000 ₽

Junior Data Scientist (Блок Финансы)

Требования:
Знания в области теории вероятностей, статистики | Понимание алгоритмов ML-моделей | Владение Python (Numpy, Sklearn, Pandas, Matplotlib / Seaborn / Plotly)
от 110 000 ₽

Вот так выглядит рост дата-сайентиста

По данным «Хабр Карьеры»
Вот так выглядит рост Python-разработчика
По данным «Хабр Карьеры»
Специалист
1–3 года опыта
от 190 000 ₽
Старший специалист
3+ года опыта
от 300 000 ₽
Руководитель
5+ лет опыта
от 390 000 ₽

Истории студентов,
окончивших курс

Как построено обучение

Программа курса составлена вместе с опытными дата-сайентистами — они прошли путь от новичка до старшего специалиста и знают, какие навыки нужны нанимающим компаниям

25 месяцев 520 часов практики 224 часа теории 7 проектов 2 финальных проекта

База

Введение

1 неделя
  • INTRO-1. Как учиться эффективно — онбординг по обучению
  • INTRO-2. Обзор профессии. Типы задач в Data Science. Этапы и подходы к разработке Data Science-проекта
Вы сможете
  • сформулировать для себя реальные цели обучения
  • узнать, в чем ценность DS для бизнеса
  • познакомиться с основными задачами дата-сайентиста
  • разобраться, как строится разработка любого DS-проекта

Проектирование разработки

5 недель
  • PYTHON-1. Основы Python
  • PYTHON-2. Погружение в типы данных
  • PYTHON-3. Условные операторы
  • PYTHON-4. Циклы
  • PYTHON-5. Функции и функциональное программирование
  • PYTHON-6. Практика
  • PYTHON-7. Бонус: гайд по стилю в среде Python
Вы сможете
  • работать с основными типами данных с помощью языка Python
  • применять в повседневной работе циклические конструкции, условные операторы и функции

Основы математики

7 недель
  • MATH-1. Числа и выражения
  • MATH-2. Уравнения и неравенства
  • MATH-3. Основные понятия теории функций
  • MATH-4. Основы геометрии: планиметрия, тригонометрия и стереометрия
  • MATH-5. Множества, логика и элементы статистики
  • MATH-6. Комбинаторика и основы теории вероятности
  • MATH-7. Решение задач
Вы научитесь:
  • совершать операции над числами
  • решать уравнения
  • использовать свойства функций и их графиков
  • решать математические задачи

Работа с данными

8 недель
1 проект
  • PYTHON-8. Инструменты Data Science
  • PYTHON-9. Библиотека NumPy
  • PYTHON-10. Введение в Pandas
  • PYTHON-11. Базовые приемы работы с данными в Pandas
  • PYTHON-12. Продвинутые приемы работы с данными в Pandas
  • PYTHON-13. Очистка данных
  • PYTHON-14. Визуализация данных
  • PYTHON-15. Принципы ООП в Python и отладка кода (дополнительный модуль)
Вы научитесь:
  • подготавливать, очищать и преобразовывать данные
  • анализировать данные с помощью популярных библиотек Matplotlib, Seaborn, Plotly

Проект 1. Аналитика датасета по закрытым вопросам

Подгрузка данных

6 недель
1 проект
  • PYTHON-16. Как выгружать данные из файлов разных форматов
  • PYTHON-17. Получение данных из веб-источников и API
  • SQL-0. Привет, SQL!
  • SQL-1. Основы SQL
  • SQL-2. Агрегатные функции
  • SQL-3. Соединение таблиц
  • SQL-4. Сложные объединения
Вы научитесь:
  • выгружать данные из разных форматов и источников при помощи SQL
  • использовать агрегатные функции, соединения таблиц и сложные объединения

Проект 2. Подгрузка новых данных. Уточнение анализа

Разведывательный анализ данных

7 недель
1 проект
  • EDA-1. Введение в разведывательный анализ данных. Алгоритмы и методы EDA
  • EDA-2. Математическая статистика в контексте EDA. Типы признаков
  • EDA-3. Проектирование признаков (Feature Engineering)
  • EDA-4. Статистический анализ данных на Python. Часть 1
  • EDA-5. Статистический анализ данных на Python.
  • EDA-6. Проектирование экспериментов
  • EDA-7. Kaggle-площадка
Вы научитесь:
  • проводить разведывательный анализ данных (EDA) с помощью библиотек Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas
  • работать на Kaggle, популярной платформе для участия в соревнованиях

Проект 3. EDA + Feature Engineering. Соревнование на Kaggle

Введение в машинное обучение

9 недель
1 проект
  • ML-1. Теория машинного обучения
  • ML-2. Обучение с учителем: регрессия
  • ML-3. Обучение с учителем: классификация
  • ML-4. Обучение без учителя: кластеризация и техники понижение размерности
  • ML-5. Валидация данных и оценка модели
  • ML-6. Отбор и селекция признаков
  • ML-7. Оптимизация гиперпараметров модели
  • ML-8. ML Cookbook
Вы научитесь:
  • обучать основные виды ML-моделей
  • проводить валидацию
  • интерпретировать результаты работы и выбирать важные признаки (feature importance)

Проект 4. Задача классификации

Основной блок

Математика и машинное обучение

6 недель
1 проект
  • MATH&ML-1. Линейная алгебра в контексте линейных методов. Часть 1
  • MATH&ML-2. Линейная алгебра в контексте линейных методов. Часть 2
  • MATH&ML-3. Математический анализ в контексте задачи оптимизации. Часть 1
  • MATH&ML-4. Математический анализ в контексте задачи оптимизации. Часть 2
  • MATH&ML-5. Математический анализ в контексте задачи оптимизации. Часть 3
Вы научитесь
  • решать практические задачи с помощью ручного счета и Python
  • производить векторные и матричные вычисления
  • работать с множествами
  • исследовать функции с помощью дифференциального анализа

Проект 5. Задача регрессии

Математика и машинное обучение

6 недель
1 проект
  • MATH&ML-6. Теория вероятностей в контексте наивного байесовского классификатора
  • MATH&ML-7. Алгоритмы на основе деревьев решений
  • MATH&ML-8. Бустинг и стекинг
  • MATH&ML-9. Кластеризация и техники понижения размерности. Часть 1
  • MATH&ML-10. Кластеризация и техники понижения размерности. Часть 2
  • Вы познакомитесь с основными понятиями теории вероятности и математической статистики, алгоритмами кластеризации.
  • Научитесь оценивать качество произведенной кластеризации и представлять результаты в графическом виде.

Проект 6. Сегментирование клиентов онлайн-магазина подарков

Дискретная математика

4 недели
  • MATH&MGU-1 Множества и комбинаторика
  • MATH&MGU-2 Логика
  • MATH&MGU-3 Графы. Часть 1
  • MATH&MGU-4 Графы. Часть 2

ML в бизнесе

8 недель
1 проект
  • MATH&ML-11. Временные ряды. Часть 1
  • MATH&ML-12. Временные ряды. Часть 2
  • MATH&ML-13. Рекомендательные системы. Часть 1
  • MATH&ML-14. Рекомендательные системы. Часть 2
  • PROD-1. Подготовка модели к продакшену
  • PROD-2. Прототип Streamlit + Heroku
  • PROD-3. Бизнес-понимание. Кейс
Вы научитесь:
  • использовать ML-библиотеки для решения задачи временных рядов и рекомендательных систем
  • обучать ML-модель и проводить ее валидацию
  • создавать работающий прототип и запускать модель в веб-интерфейсе
  • проводить A/B-тесты для оценки модели

Проект 7. Тема на выбор: временные ряды или рекомендательные системы

Уровень PRO

Профориентация: ML или CV

10 недель

Вам предстоит сделать выбор, по какому пути двигаться дальше.

Вы узнаете о каждой специализации и решите несколько практических задач, чтобы было проще определиться.

ML-инженер

29 недель
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в продакшене
  • Углубленное изучение ML-разработки
Вы научитесь:
  • решать углубленные задачи машинного обучения
  • работать с библиотеками Python
  • создавать MVP (минимально жизнеспособную версию продукта)

Выпускной проект по выбранной теме

CV-инженер

29 недель
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в продакшене
  • Углубленное изучение ML-разработки
Вы научитесь:
  • решать задачи компьютерного зрения (классификация изображений, сегментация и детекция, генерация и стилизация)
  • выводить нейронные сети в продакшен

Выпускной проект по выбранной теме

«Моторика»

Пройдете стажировку от компании-партнера

В рамках стажировки вы усовершенствуете прототип протеза руки на базе оптических датчиков. Это отличная возможность применить полученные знания на практике и добавить проект в портфолио
Российский разработчик и производитель роботизированных функциональных тяговых
и бионических протезов рук для детей и взрослых
Остались вопросы
по программе? Оставляйте заявку на бесплатную консультацию
Ответим на ваши вопросы и поможем забронировать место на курсе
Нажимая кнопку, я соглашаюсь с Положением о персональных данных и даю согласие на их обработку и хранение

Кто обучает студентов

Куратор, преподаватели и менторы — опытные дата-сайентисты. Они составляют программу, следят за ее актуальностью
на рынке, продумывают и проверяют задания

Алексей Семенов

Академик РАН
Заведующий кафедрой математической логики и теории алгоритмов МГУ

Эмиль Магеррамов

Ведущий автор разделов ML и DS
Руководитель группы вычислительной химии в BIOCAD

Создает сервисы и модели машинного обучения, которые помогают химикам быстрее выпускать лекарства

Михаил Баранов

Автор раздела курса
Эксперт по Data Science

Компетенции: машинное обучение, большие данные, Python

Маргарита Бурова

Ведущий автор раздела MATH&ML
Эксперт по Data Science
Компетенции: Python, машинное обучение, статистика, анализ данных

Александр Рыжков

Автор раздела про Kaggle
Руководитель команды LightAutoML
Kaggle Grandmaster

Компетенции: ML/DS, Python, математика, статистика, Kaggle

Екатерина Трофимова

Автор модулей по EDA
Исследователь лаборатории методов анализа больших данных, факультет компьютерных наук НИУ ВШЭ

Компетенции: Python, PyTorch, CV, GNN

Мария Жарова

Data Scientist в Wildberries

Владимир Горюнов

Антон Киселев

Ведущий автор раздела «Введение в DS»
Head of Marketing Analytics, Playrix
Эксперт по данным с опытом 15+ лет

Компетенции: Data Science
Ментор Skillfactory на курсах по Data Science, Data Engineering и fullstack-разработке на Python

Леонид Саночкин

Ментор по NLP

Андрей Рысистов

Автор модулей по Python и ML
Эксперт DS, преподаватель Skillfactory, автор курсов, автор и соавтор нескольких научных исследований и работ.
Сфера интересов — искусственный интеллект в авиационных технических системах

Елена Мартынова

Научный сотрудник AIRI
10+ лет занимается исследованиями в области NLP
Ментор Skillfactory
Компетенции: BI, SQL, Python, аналитика
Ментор
Ментор
Ментор
Ментор

Алек Леков

Senior ML Engineer, МТС
Основные компетенции — временные ряды, Deep Learning и нейронные сети.
Занимается консалтингом в сфере AI
КУРАТОР КУРСА

Как проходит
обучение

В среднем оно занимает 10 часов в неделю — это 2 часа учебы в день по будням или 5 часов по выходным. Доступ к материалам курса остается навсегда

  • Формат
    • Теория на понятном языке и много практики внутри единой онлайн- платформы
    • Записанные лекции и задания для самостоятельной работы
    • Разбор сложных тем на вебинарах с менторами
    • Тренажеры с десятками заданий в каждом модуле программы
  • Обратная связь
    • Менторы и координаторы поддержат и ответят на вопросы
    • Менторы — опытные дата-сайентисты. Помогут разобраться в темах и проверят домашние задания.
    • Координаторы — команда заботы о студентах. Решат организационные вопросы, поддержат и помогут пройти обучение до конца.
  • IT-сообщество
    • На курсе у вас появятся связи, полезные для продвижения в сфере
    • Общий чат курса, чтобы общаться с другими студентами
    • Чат с ментором, чтобы прояснить непонятные темы и задания
    • Мероприятия и стажировки с партнерами, чтобы наработать опыт и показать свои скиллы работодателям
  • Центр карьеры
    • Поможем построить новую карьеру и будем с вами до самого оффера
    • Соберем сильное резюме и расскажем, где искать вакансии
    • Сформируем карьерный трек и подготовим к поиску работы
    • Потренируем проходить собеседования
    • Научим искать работу за рубежом

Официальные документы

Мы обучаем аналитиков по государственной лицензии. В конце курса выдаем документы, которые подтвердят ваши навыки

Диплом

Получите диплом о профессиональной переподготовке установленного образца

Сертификат

Можем перевести на английский и добавить рекомендацию куратора
Сертификат о прохождении курса «Профессия Python-Разработчик»

Тарифы обучения

Осталось 10 мест

Скидка действует при записи на ближайший поток

-40%

Базовый

Для самостоятельных студентов

  • 9 проектов в портфолио

  • Стажировка от компании-партнера

  • Модуль продвинутой математики для Data Science

  • Карьерный курс и поддержка

  • Консультации с экспертом в Data Science

  • Тестовое техническое собеседование

  • Карьерная консультация

  • Ревью резюме

  • Мини-курс «Английский для IT»

  • Реализация личного/рабочего проекта с экспертом

6 717 ₽/мес.

4 030 ₽/мес.

на 36 месяцев в рассрочку, или сразу, с дополнительной скидкой 10% — 219 996 ₽

оплатить курс
забронировать место

-40%

Персональный

Для тех, кому важна поддержка

  • 9 проектов в портфолио

  • Стажировка от компании-партнера

  • Модуль продвинутой математики для Data Science

  • Карьерный курс и поддержка

  • 12 консультаций с экспертом в Data Science

  • Тестовое техническое собеседование

  • Карьерная консультация

  • Ревью резюме

  • Мини-курс «Английский для IT»

  • Реализация личного/рабочего проекта с экспертом

6 717 ₽/мес.

4 030 ₽/мес.

на 36 месяцев в рассрочку, или сразу, с дополнительной скидкой 10% — 219 996 ₽

забронировать место

-40%

Персональный+

Для тех, кто хочет получить максимум

  • 9 проектов в портфолио

  • Стажировка от компании-партнера

  • Модуль продвинутой математики для Data Science

  • Карьерный курс и поддержка

  • 48 консультаций с экспертом в Data Science

  • Тестовое техническое собеседование

  • Карьерная консультация

  • Ревью резюме

  • Мини-курс «Английский для IT»

  • Реализация личного/рабочего проекта с экспертом

6 717 ₽/мес.

4 030 ₽/мес.

на 36 месяцев в рассрочку, или сразу, с дополнительной скидкой 10% — 219 996 ₽

забронировать место
Если есть сомнения или что-то непонятно, оставьте заявку на консультацию
Бесплатно ответим на вопросы и поможем забронировать место на курсе
Нажимая кнопку, я соглашаюсь с Положением о персональных данных и даю согласие на их обработку и хранение

Часто задаваемые
вопросы

  • Нужны ли мне знания в математике или других точных науках, чтобы изучать Data Science?

    Нет, вам не понадобится знаний, выходящих за рамки школьной программы. Мы будем учить той математике, которая пригодится. Если вы когда-то были знакомы с высшей математикой и статистикой, то вы сможете быстрее вспомнить материал.

  • В чем разница между дата-аналитиком и дата-сайентистом?

    Основное отличие в том, что аналитик работает с ретроспективными данными здесь и сейчас. Например, он может построить дашборд со всеми показателями компании, определить падающие метрики и дать рекомендации по их улучшению.

    Дата-сайентист тоже работает с данными, но, в отличе от аналитика, он создает модели, которые предсказывают будущее. Например, он может разработать модель, которая будет анализировать поведение покупателя на маркетплейсе и рекомендовать ему нужные товары.

  • Какое оборудование нужно для обучения?

    Ноутбук или стационарный компьютер на macOS или Windows версии Vista и выше. Желательный объем оперативной памяти — от 8 ГБ. Все инструкции по установке необходимого ПО вышлем до начала обучения.

  • Что будет, если я не успею выполнить задания или пропущу часть занятий?

    Мы предложим вам перевестись на один из следующих потоков курса или включить заморозку обучения. С этим и другими вопросами можно обратиться к координатору курса.

  • Нужен ли английский для прохождения курса?

    Нет, все обучение — на русском языке. Иногда мы можем давать ссылки на англоязычные материалы, но только на дополнительные, а не основные.

  • Отрасли применения Data Science

    С помощью обучающих алгоритмов машинного обучения можно научить программы делать что угодно:

    1. Предлагать дополнительные товары, которые пользователь купит с наибольшей вероятностью, на основе его поведения на сайте и покупок. Таким образом увеличивать продажи и прибыль бизнеса. Этому вы научитесь в модулях по рекомендательным системам.

    2. Предсказывать события в клиентской базе. Таким образом можно заранее предпринять меры, которые сократят расходы или увеличат прибыль. Возьмем для примера страховую компанию, которая предоставляет услуги ДМС. Если она научит программу предсказывать, кто из клиентов в ближайшее время обратится за дорогостоящей медицинской услугой, то сможет предпринять меры, чтобы сократить расходы по ДМС. Например, позвонить клиенту и предложить ему проконсультироваться с хорошим врачом, чтобы не допустить развития болезни. Прогнозирование вы изучите в блоке «Введение в машинное обучение».

    3. Формировать заказы на поставку для магазинов сети с учетом динамики продаж, сезона, прогноза погоды и других параметров. Таким образом не допускать, чтобы в торговых точках было затоваривание или нехватка товара. Построению таких моделей посвящены разделы курса по анализу временных рядов.

    4. Сегментировать клиентов, чтобы делать им подходящие предложения. Возьмем для примера банк, который создал новый вид кредита. С помощью машинного обучения он может выявить в базе клиентов тех, кто вероятнее всего воспользуется таким кредитом. Решать такие задачи вы научитесь в блоке «Математика и углубленное машинное обучение».

    5. Области применения машинного обучения и Python практически безграничны: от контроля качества товаров до диагностики оборудования на производстве, от продаж до аналитики, от повышения персонализации до аудита. Вы сможете использовать возможности алгоритмов практически в любой сфере. Проекты нашей учебной программы не ограничены какой-то определенной индустрией — вы сможете понять весь спектр применения анализа данных.

  • Зачем это мне?

    По версии кадрового агентства Glassdoor профессия Data Scientist, напрямую связанная с машинным обучением, занимает первую строчку в рейтинге самых лучших профессий США.

    Ценятся такие специалисты высоко. Журнал IncRussia пишет, что зарплата специалиста по машинному обучению составляет 130 000 ₽ — 300 000 ₽. Причина в том, что на рынке мало специалистов в области Data Science. Квалификация в этой области поможет вам совершить рывок в текущей работе или запуске собственного проекта.

  • Что потребуется для успешного обучения?

    Ноутбук с установленным Python (мы дадим инструкцию и поможем с установкой). Около 8-10 часов в неделю и желание получить новые знания.

  • Нужно ли быть программистом, чтобы освоить Data Science?

    Нет, не нужно. Мы научим вас программировать.

  • У меня не очень мощный компьютер. Я смогу заниматься?

    Сможете, конечно! Для занятий не нужен мощный домашний компьютер или дорогая видеокарта. Достаточно компьютера с выходом в интернет. Мы научим вас использовать облачные технологии для вычислений.

  • Сколько времени нужно будет уделять учебе? Я еще и работаю!

    От 8 часов в неделю. Если уже есть опыт в этой сфере, то занятия и выполнение заданий займут меньше времени. Можно заниматься в удобном для вас графике.

  • Что лучше: аналитик данных или Data Scientist?

    Думаем, неверно ставить вопрос таким образом. Лучше то, что вам больше нравится. Сферы специалистов похожи, но деятельность и результат разные.

    Основное отличие в том, что дата-аналитик работает с ретроспективными данными и помогает руководителям бизнеса принимать решения на их основе. А дата-сайентист смотрит в будущее и создает такие модели, которые могут упростить, модифицировать, улучшить процессы в работе компании.

  • Какое образование должно быть у аналитика данных?

    В аналитику можно прийти из любой сферы и изучать направление с нуля. Бонусом будет техническое и IT-образование.

  • Как долго учиться на аналитика данных?

    Обучение может длиться от пяти месяцев до пяти лет — это зависит от образовательного учреждения. Курс «Data Scientist с нуля до PRO» от Skillfactory рассчитан на 25 месяцев. За это время вы освоите продвинутую математику с азов, научитесь создавать ML-модели и работать с нейросетями, получите реальный опыт на практических проектах. Выйдете на рынок подготовленным специалистом, а с помощью Центра карьеры сможете найти работу быстрее.

  • В чем разница между Data Science и Machine Learning?

    Направления отличаются целями и задачами. Data Science извлекает полезную информацию из данных и предоставляет выводы для принятия решений. Она исследует паттерны, использует статистику, визуализирует данные. Machine Learning фокусируется на создании моделей, способных автоматически делать прогнозы на основе данных.

  • В чем разница между Data Scientist и Data Engineer?

    У специалистов разные цели в работе. Data Scientist решает задачи бизнеса: строит прогнозные модели, проверяет гипотезы, делает выводы. Data Engineer отвечает за удобное и надежное хранение информации и быстрый доступ к ней. Это позволяет другим специалистам работать с корректными и актуальными данными.

  • Какова ваша политика возврата денег за курсы?

    Мы стараемся гибко подходить к вашим потребностям. Поэтому учитываем обстоятельства и возвращаем стоимость обучения полностью или частично, когда это предусмотрено договором. Если вы передумали проходить курс или хотите оформить возврат по другой причине, позвоните на горячую линию — менеджер расскажет об условиях. Они также описаны в разделе 4 нашей оферты