Онлайн-курс «Data Scientist с нуля до PRO» совместно с академиком РАН из МГУ
Разработан совместно с академиком РАН из МГУ им. М.В. Ломоносова
→ Освойте продвинутую математику с самых азов
→ Научитесь создавать ML-модели и работать с нейронными сетями
Получите реальный опыт на практических проектах
Начните работать удаленно

Data Scientist с нуля до PRO

Углубленный курс науки о данных
Длительность:
25 месяцев
Формат:
онлайн в любое время
Уровень подготовки:
с нуля
Старт обучения: 25 января
Не требуется опыт в программировании

Углубленный курс «Data Scientist с нуля до PRO» от МГУ

Присоединитесь к новому потоку или начните учиться в удобное время
Искусственная нейросеть (нейронная сеть или нейросеть) — это программа, которая повторяет модель человеческих нейронных связей. На их основе создают обучаемые программы, которые можно научить распознавать или генерировать контент.

Курс разработан совместно с академиком РАН из МГУ им. Ломоносова

Алексей Львович Семенов — заведующий кафедрой математической логики и теории алгоритмов МГУ.

Участник разработок ПО для ИИ и для суперкомпьютеров, лауреат премии ЮНЕСКО в области цифровых технологий в образовании и премии им. А. Н. Колмогорова за выдающиеся достижения в области математики.
Московский государственный университет им.⦁М.В. Ломоносова
В топ-25
По качеству образования в Рейтинге лучших университетов мира Times Higher Education (THE) 2021

В топ-110
По критерию «Успешность выпускников» в Мировом рейтинге QS 2020

В топ-34
Среди вузов мира по математике в QS World University Rankings by Subject-2021
Московский государственный университет им. М.В. Ломоносова
Лучший ВУЗ России по версии RAEX
03
04
7 из 10 работодателей нанимают людей с опытом

Вы получите реальный опыт

Это формат, где студенты решают реальные задачи бизнеса. У вас будет опыт, которого так не хватает выпускникам онлайн-школ. Вместе с ментором вы решите кейс для компании-партнера — и получите фидбэк от потенциального работодателя.
Реальный опыт даст студентам:
Реальные проекты в портфолио
Участие в стажировках и хакатонах
Шанс получить оффер от компании-заказчика
Опыт работы над проектом в команде
01
02
Поэтому мы придумали Фэктори
Хакатон — это соревнование, в котором команды создают на время прототип мобильного приложения, веб-сервиса или другого продукта для решения проблемы, с которой столкнулся заказчик. Понятие образовано от слов hack и marathon. В переводе с английского hackathon — это «марафон для хакеров».
Кейс — это описание конкретной ситуации и способов ее решения.

Модель распознавания жестов

Разработаете систему принятия решений, которая в режиме реального времени сможет реконструировать положение согнутых пальцев руки здорового пользователя. Преуспевшие студенты продолжат сотрудничество с компанией.
  • Sklearn
  • EDA
Супер Моторика
Python — это высокоуровневый язык программирования, отличающийся эффективностью, простотой и универсальностью использования. Он широко применяется в разработке веб-приложений и прикладного программного обеспечения, а также в машинном обучении и обработке больших данных.
Pandas — это библиотека Python для обработки и анализа структурированных данных, её название происходит от «panel data» («панельные данные»). Панельными данными называют информацию, полученную в результате исследований и структурированную в виде таблиц.
Keras — это библиотека для языка программирования Python, которая предназначена для глубокого машинного обучения. Она позволяет быстрее создавать и настраивать модели — схемы, по которым распространяется и подсчитывается информация при обучении.

Анализ и сортировка данных

Вам предоставят изображения транспортных средств различных типов и с разных ракурсов. С помощью дескрипторов вы разобьете картинки на кластеры и интерпретируете каждый из них. В результате получите кейс в портфолио и обратную связь от эксперта из компании.
  • Pandas
  • ML
Intellivision
Intellivision
NumPy — это библиотека Python, которую применяют для математических вычислений: начиная с базовых функций и заканчивая линейной алгеброй. Полное название библиотеки — Numerical Python extensions, или «Числовые расширения Python».
Это специалист, который обрабатывает большие объемы неструктурированной информации и превращает ее в упорядоченный набор данных.

Дата-сайентист может:

Кто такой Data Scientist

Предсказать, окупится ли новый проект
Оценить будущий спрос на товары и услуги
Улучшить системы рекомендаций в соцсетях и сервисах
Создать приборы для автоматической постановки диагноза пациенту
Усовершенствовать транспортное движение
Построить систему распознавания лиц
Дата-сайентист использует методы науки о данных (Data Science), строит и тестирует математические модели. Он находит закономерности, дает прогнозы и предлагает лучшие решения в разных сферах.

Вы вспомните школьную математику и освоите углубленный уровень для Data Science, чтобы:

Научиться не просто работать с алгоритмами машинного обучения, но и создавать и развивать их
Использовать в работе фундаментальные основы анализа данных
Успешно проходить технические собеседования в компаниях уровня Google и Яндекс
Решать сложные бизнес-задачи и иметь конкурентное преимущество на рынке
Общаться с другими дата-сайентистами на одном языке

Как Data Science применяется в жизни

Специалисты подразделения Google AI, занимающегося искусственным интеллектом, создали модель глубокого обучения (Deep Learning) для распознавания кожных болезней. DL-модель может диагностировать 26 болезней кожи с точностью 97%.
Компания Frontier Development Lab вместе со студентами из разных стран и специалистами Nvidia, разработала алгоритм, способный создать 3D-модель астероида за четыре дня. Этот метод используют сегодня для моделирования формы астероидов в реальном времени. А NASA применяет алгоритм NASA визуализации данных о космическом мусоре.
Компания Google создала приложение, которое позволяет слабовидящим и слепым узнавать об объектах рядом с ними — оно в реальном времени распознает на изображении с камеры объекты и передает информацию пользователю. Еще оно умеет зачитывать текст, знаки, штрих-коды и другие визуальные объекты.

Распознавание кожных заболеваний

Алгоритм моделирования астероидов

Распознавание объектов для слабовидящих и слепых

Deep learning (глубокое обучение) — это вид машинного обучения с использованием многослойных нейронных сетей, которые самообучаются на большом наборе данных.
По данным Всемирного экономического форума, работа в Data Science занимает первое место в рейтинге профессий с самым большим спросом на рынке до 2025 года.

Количество вакансий в Data Science выросло на 433% за 3 года

Ритейл, киберспорт, путешествия, образование, медицина — грамотный Data Scientist нужен практически в любой индустрии, а спрос значительно превышает предложение.
Вакансия Data Scientist Middle
Вакансия Data Scientist от Mail.ru
Вакансия Data Scientist
Вакансия Data Scientist Middle от Qiwi

Новичок

Программа расчитана на обучение науке о данных с нуля. Вы начнете с SQL и Python. Получите необходимую теорию по математике, статистике и теории вероятности и отработаете ее на практике. А через год легко сможете решать задачи и устроитесь на новую работу.

Программист

Научитесь работать с моделями машинного обучения, анализировать данные на Python и прокачаете аналитическое мышление.

Вам подойдет этот курс, если вы

Аналитик

Начнете анализировать данные на продвинутом уровне, автоматизировать процесс сбора данных. Научитесь обучать модели и делать прогнозы, а также применять это для решения бизнес-задач.
SQL (от англ. Structured Query Language) — это структурированный язык запросов, созданный для того, чтобы получать из базы данных необходимую информацию.
Python — это высокоуровневый язык программирования, отличающийся эффективностью, простотой и универсальностью использования.

После наших курсов студенты в среднем зарабатывают 180 000 ₽

Развивайте навыки и растите в цене

Senior-специалист
в иностранной компании

Middle-специалист

Junior-специалист

Senior-специалист

*По данным hh.ru и indeed.com
8 000 $
250 000 ₽
180 000 ₽
80 000 ₽
Чтобы посмотреть как устроена работа в большой IT-компании
Чтобы быстрее влиться в среду
Чтобы расти в карьере и работать из любой точки мира

Кем вы станете

После базового курса вы сможете выбрать более узкую специализацию в Data Science: ML Engineer или CV Engineer.
  • Разработаете модель предсказания кредитного рейтинга
  • Решите задачу классификации спама СМС-сообщений
  • Разработаете систему рекомендаций подходящих товаров при покупке
  • Построите модель для увеличения продаж в розничном бизнесе
  • Создадите изображения по текстовому описанию с помощью нейросети DALL-E
чем занимается ML Engineer

ML Engineer — Разработчик машинного обучения

Спам — это массовая рассылка рекламных или информационных писем пользователям без их согласия на это.

CV Engineer — Специалист по компьютерному зрению

  • Научитесь решать все базовые задачи в сфере Computer Vision
  • Приобретёте знание реального флоу работы с моделями CV, актуальных подходов и продвинутых инструментов, необходимых для создания CV-сервисов
  • В итоговом проекте создадите виртуального коуча, способного оценивать правильность выполнения упражнений на видео
CV Engineer — Специалист по компьютерному зрению

Начните путь в Data Science уже сейчас

Забронируйте курс со скидкой
до 25 января
скидка
40%
Сопровождаем вас на всем пути, пока не получите тот самый оффер

Центр карьеры

Вместе создадим резюме,
которое зацепит внимание работодателя и подсветит ваши достоинства кандидата на вакансию.
Дадим рекомендации по карьере. С карьерным консультантом вы сформируете план действий по достижению цели.
Поможем выйти на работу в зарубежную компанию — у наших HR-специалистов есть опыт подбора персонала на рынках США, Европы, Азии.
Познакомим с представителями компаний-работодателей. Узнаете, каких кандидатов предпочитают и что сделать, чтобы попасть в компанию мечты.
Научим проходить интервью с IT-рекрутерами и HR-менеджерами.
Получите обратную связь и поймете, как перейти на следующий этап отбора.
Здесь начинающие специалисты:
В нашем карьерном сообществе 9000+ студентов и выпускников
  • Знакомятся с трендами и перспективами IT-рынка
  • Узнают о карьерных мероприятиях и вакансиях наших компаний-партнеров
  • Объединяются в команды для участия в хакатонах и ищут единомышленников для собственных проектов
  • Обмениваются опытом трудоустройства: делятся тестовыми заданиями и вопросами технических интервью
компаний работают с нами на постоянной основе
> 200
наших студентов получили новую работу или повышение на старой
71 %
студентов после ревью резюме Центром карьеры работодатели пригласили на собеседование
81 %
Это консультанты и карьерные коучи с узкой специализацией и опытом 10+ лет в HR и IT-рекрутинге в России и за рубежом
С вами будет работать команда из 40+ профессионалов в области карьеры

Эффективный формат онлайн-обучения

Занимайтесь в своем темпе

Наши курсы ориентированы на тех, кто работает и хочет сам регулировать нагрузку. Занимайтесь без отрыва от работы и выделяйте на учебу столько времени, сколько есть прямо сейчас (15 минут или 2 часа в день).

20% обучения — интересная и важная теория

Теория разбита на короткие блоки, после которых обязательно идет практика.

Вы смотрите короткие видео, изучаете текстовые материалы и приступаете к заданиям, чтобы закрепить знания.

80% обучения — практика в разных форматах

Для развития навыков у нас есть 5 видов практики: тренажеры, тесты, домашние задания, проекты и хакатоны. Разнообразие форматов помогает усваивать знания максимально эффективно.

Менторы и координаторы помогут дойти до конца

Все менторы — опытные практики из IT-индустрии. Они дают качественную обратную связь на задания, отвечают на вопросы и помогают студенту достичь своих целей во время обучения. Выпускники оценивают менторскую поддержку на 9,1 балла из 10.

Координаторы постоянно на связи, чтобы решить любой организационный вопрос. Их задача — мотивировать студентов и помочь пройти курс до конца.

Фокус на подготовке к трудоустройству

Вы тренируетесь на кейсах компаний, а также делаете проекты для реальных заказчиков в команде. Помогаем оформить резюме и подготовиться к собеседованиям.

Лучших студентов рекомендуем по накопленной базе работодателей. На стажировках в компаниях-партнерах вы отработаете навыки и пообщаетесь с потенциальными работодателями.
БАЗА
На этом этапе вы изучите основы программирования на Python, научитесь предобрабатывать и анализировать данные, а также познакомитесь с основными задачами дата-сайентиста.

Программа курса
«Data Scientist с нуля до PRO»

Введение

1 неделя
Вы сможете сформулировать для себя реальные цели обучения, узнаете, в чем ценность DS для бизнеса, познакомитесь с основными задачами дата-сайентиста и разберетесь, как строится разработка любого DS-проекта.
  • INTRO-1. Как учиться эффективно — онбординг в обучение
  • INTRO-2. Обзор профессии. Типы задач в Data Science. Этапы и подходы к разработке Data Science проекта

Проектирование разработки

5 недель
Вы научитесь работать с основными типами данных с помощью языка Python и сможете применять в повседневной работе циклические конструкции, условные операторы и функции.
Цикл в программировании — это управляющая конструкция, которая заставляет какой-то блок кода выполняться несколько раз.
Функциональные языки программирования — это языки, в которых процессы представлены как функции в математическом понимании этого слова.

Основы математики

7 недель
  • MATH-1. Числа и выражения
  • MATH-2. Уравнения и неравенства
  • MATH-3. Основные понятия теории функций
  • MATH-4. Основы геометрии: планиметрия, тригонометрия и стереометрия
  • MATH-5. Множества, логика и элементы статистики
  • MATH-6. Комбинаторика и основы теории вероятности
  • MATH-7. Решение задач

Работа с данными

8 недель
На этом этапе вы овладеете базовыми навыками работы с данными: научитесь подготавливать, очищать и преобразовывать данные так, чтобы они были пригодны для анализа. Кстати, об анализе: вы будете анализировать данные с помощью популярных библиотек Matplotlib, Seaborn, Plotly.
  • PYTHON-8. Инструменты Data Science
  • PYTHON-9. Библиотека NumPy
  • PYTHON-10. Введение в Pandas
  • PYTHON-11. Базовые приемы работы с данными в Pandas
  • PYTHON-12. Продвинутые приемы работы с данными в Pandas
  • PYTHON-13. Очистка данных
  • PYTHON-14. Визуализация данных
  • PYTHON-15. Принципы ООП в Python и отладка кода (дополнительный модуль)
  • Проект 1. Аналитика датасета по закрытым вопросам
Matplotlib — это библиотека на языке Python для визуализации данных. В ней можно построить двумерные (плоские) и трехмерные графики.
Seaborn — это мощная и гибкая библиотека визуализации данных для Python, строящая свою работу поверх библиотеки Matplotlib.
Pandas — это библиотека Python для обработки и анализа структурированных данных, её название происходит от «panel data» («панельные данные»).
Объектно-ориентированное программирование (ООП) — это подход, при котором программа рассматривается как набор объектов, взаимодействующих друг с другом.
Отладка, или debugging, — это поиск (локализация), анализ и устранение ошибок в программном обеспечении, которые были найдены во время тестирования.

Подгрузка данных

6 недель
Вы сможете выгружать данные из разных форматов и источников. А поможет вам в этом SQL — язык структурированных запросов. Вы научитесь использовать агрегатные функции, соединения таблиц и сложные объединения.
  • PYTHON-16. Как выгружать данные из файлов разных форматов
  • PYTHON-17. Получение данных из веб-источников и API
  • SQL-0. Привет, SQL!
  • SQL-1. Основы SQL
  • SQL-2. Агрегатные функции
  • SQL-3. Соединение таблиц
  • SQL-4. Сложные объединения
  • Проект 2. Подгрузка новых данных. Уточнение анализа
API — это способ обмена информацией между сайтами, программами и приложениями. Можно также сказать, что это набор правил, по которым осуществляется такой обмен.

Статистический анализ данных

7 недель
Разведывательный анализ данных (EDA) — вот, что окажется в центре вашего внимания. Вы познакомитесь со всеми этапами такого анализа и научитесь проводить его с помощью библиотек Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Кроме того, вам удастся поработать на Kaggle, популярном сервисе по участию в соревнованиях.
  • EDA-1. Введение в разведывательный анализ данных. Алгоритмы и методы EDA
  • EDA-2. Математическая статистика в контексте EDA. Типы признаков
  • EDA-3. Проектирование признаков (Feature Engineering)
  • EDA-4. Статистический анализ данных на Питоне
  • EDA-5. Статистический анализ данных на Питоне. Часть 2
  • EDA-6. Проектирование экспериментов
  • EDA-7. Kaggle площадка
  • Проект 2
Алгоритм — это четкая последовательность действий, выполнение которой дает какой-то заранее известный результат. Простыми словами, это набор инструкций для конкретной задачи.

Введение в машинное обучение

9 недель
Вы познакомитесь с ML-библиотеками для моделирования зависимостей в данных. Вы сможете обучить основные виды ML-моделей, провести валидацию, интерпретировать результаты работы и выбрать важные признаки (feature importance).
  • ML-1. Теория машинного обучения
  • ML-2. Обучение с учителем: Регрессия
  • ML-3. Обучение с учителем: Классификация
  • ML-4. Обучение без учителя: Кластеризация и техники понижение размерности
  • ML-5. Валидация данных и оценка модели
  • ML-6. Отбор и селекция признаков
  • ML-7. Оптимизация гиперпараметров модели
  • ML-8. ML Cookbook
  • Проект 3. Задача классификации
Кластеризация — это разбиение множества объектов на подмножества (кластеры) по заданному критерию. Каждый кластер включает максимально схожие между собой объекты.
Валидация HTML-разметки — это проверка кода веб-страницы на соответствие стандартам Консорциума Всемирной паутины (World Wide Web Consortium, W3C).
ОСНОВНОЙ БЛОК
Линейная алгебра, математический анализ, дискретная математика — звучит страшно, но не пугайтесь: разберем все эти предметы и научим с ними работать! На втором этапе вы погрузитесь в математику и основы машинного обучения, узнаете больше о профессиях DS, а также благодаря профориентации выберите трек обучения второго года.

Математика и машинное обучение. Часть 1

6 недель
Вы сможете решать практические задачи с помощью ручного счета и Python (векторные и матричные вычисления, работа с множествами, исследование функций с помощью дифференциального анализа).
  • MATH&ML-1. Линейная алгебра в контексте Линейных методов. Часть 1
  • MATH&ML-2. Линейная алгебра в контексте Линейных методов. Часть 2
  • MATH&ML-3. Математический анализ в контексте задачи оптимизации Часть 1
  • MATH&ML-4. Математический анализ в контексте задачи оптимизации. Часть 2
  • MATH&ML-5. Математический анализ в контексте задачи оптимизации. Часть 3
  • Проект 4. Задача регрессии

Математика и машинное обучение. Часть 2

6 недель
Вы познакомитесь с основными понятиями теории вероятности и математической статистики, алгоритмами кластеризации, а также научитесь оценивать качество произведенной кластеризации и представлять результаты в графическом виде.
  • MATH&ML-6. Теория вероятностей в контексте Наивного Байесовского классификатора
  • MATH&ML-7. Алгоритмы на основе Деревьев решений
  • MATH&ML-8. Бустинг & Стекинг
  • MATH&ML-9. Кластеризация и техники понижение размерности. Часть 1
  • MATH&ML-10. Кластеризация и техники понижение размерности. Часть 2
  • Проект 5. Ансамблевые методы
Байесовский классификатор — это один из способов решить задачу классификации объектов с помощью формулы Байеса из теории вероятностей.

Дискретная математика

4 недели
  • MATH&MGU-1 Множества и комбинаторика
  • MATH&MGU-2 Логика
  • MATH&MGU-3 Графы. Часть 1
  • MATH&MGU-4 Графы. Часть 2

ML в бизнесе

8 недель
Вы научитесь использовать ML-библиотеки для решения задачи временных рядов и рекомендательных систем. Вы сможете обучить ML-модель и провести её валидацию, а также создать работающий прототип и запустить модель в веб-интерфейсе. А ещё получите навыки A/B-тестирования, чтобы можно было оценить модель.
  • MATH&ML-11. Временные ряды. Часть 1
  • MATH&ML-12. Временные ряды. Часть 2
  • MATH&ML-13. Рекомендательные системы. Часть 1
  • MATH&ML-14. Рекомендательные системы. Часть 2
  • PROD-1. Подготовка модели к Production
  • PROD-2. Прототип Streamlit+Heroku
  • PROD-3. Бизнес понимание. Кейс
  • Проект 6. Тема на выбор: Временные ряды или Рекомендательные системы
Streamlit — это фреймворк для языка программирования Python. Он содержит набор программных инструментов, которые помогают перенести модель машинного обучения в веб.
Heroku — облачная мультиязычная платформа как услуга (PaaS), основанная на управляемой контейнерной системе, с интегрированными службами передачи данных и развитой экосистемой для развертывания и запуска приложений.
УРОВЕНЬ PRO
На третьем этапе вы познакомитесь с одним из методов машинного обучения — глубоким обучением (DL). А также вас ждет полноценный блок выбранной специализации: вы можете освоить навыки машинного обучения (ML), познакомиться с рутиной CV (компьютерного зрения).
Второй год обучения - 2 специализации на выбор

Профориентация

10 недель
ML или CV: на этом этапе вам наконец предстоит сделать выбор, по какому пути двигаться дальше. Мы расскажем о каждой специализации и предложим решить несколько практических задач, чтобы вам было проще определиться.

Трек ML - Engineer

29 недель
В ML-треке вы научитесь решать углубленные задачи машинного обучения, овладеете компетенциями дата-инженера, отточите навык работы с библиотеками Python. Также вы научитесь создавать MVP (минимально жизнеспособную версию продукта), узнаете все тонкости вывода ML-модели в продакшн и узнаете, как работают ML-инженеры в реальной жизни.
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в Production
  • Углубленное изучение ML-разработки и выпускной проект по выбранной теме
MVP — это Minimum Viable Product, минимально жизнеспособный продукт. Так называется продукт, который еще не готов до конца, но который тем не менее уже можно выпускать на рынок.

Трек CV - Engineer

29 недель
На CV-треке вы научитесь решать такие задачи компьютерного зрения, как классификация изображений, сегментация и детекция, генерация и стилизация картинок, восстановление и повышение качества фотографий. Кроме того, вы узнаете, как выкатывать нейронные сети в продакшн.
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в Production
  • Углубленное изучение ML-разработки и выпускной проект по выбранной теме

Deep Learning и нейронные сети

БОНУС
Где применяются нейросети? Как обучить нейронную сеть? Что такое Deep Learning? Ответы на эти вопросы вы узнаете в бонусном разделе DL.

Введение в Data Engineering