Курс по Data Engineering

Практический курс по одному из самых перспективных направлений в Big Data
Онлайн
из любой точки мира
идет набор
дата старта
10 недель
длительность курса
Научитесь строить пайплайны данных в реальном времени
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или модели прогнозирования. Data Engineer - это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.

Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.

Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python. За два месяца вы освоите все важные этапы Data Engineering.
Скидка 30% на курс
Забронируйте курс по спеццене — со скидкой 30%!
Преподаватель
Михаил Королев
Ведущий Data Engineer в Альфастрахование

  • Системный программист, изобретатель, руководитель, наставник
  • Серьезно занимался параллельным программированием
  • Имеет большой опыт в ритейле, страховании и брокерском бизнесе
  • Работает с данными с 1996 года
  • Приверженец и практик в Agile и самоуправлении
  • Работал в крупных, в том числе зарубежных компаниях

Курс из специализации Data Scientist

Курс по Data Engineer
Data-driven management
Python
Math&Stat
Machine
Learning

Deep
Learning

Data
Engineering

Менеджмент
Программа курса
Введение, практический linux
Кто такой Data Engineer и зачем ему Linux?
Модуль 1
Модуль 1
Современные хранилища данных
Разнообразие баз данных и их особенности
Модуль 2
Модуль 2
Экосистема Hadoop
Что такое Hadoop, что он умеет и как им пользоваться
Модуль 3
Модуль 3
Источники данных и работа с ними
Файлы как источники данных, JDBC - структурированные данные, SQL для выгрузки данных
Модуль 4
Модуль 4
Apache Spark и обработка данных
Зачем нужен Apache Spark и как с ним работать
Модуль 5
Модуль 5
Hadoop как хранилище данных
Особенности и нюансы hdfs
Модуль 6
Модуль 6
Apache Airflow для оркестрации конвейеров
Настройка data pipelines
Модуль 7
Модуль 7
Обзор облачных хранилищ
Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure
Получить программу
А также подробный план развития в области Data Engineering
Преимущества курса
В рамках курса вас ждет сквозной проект - реальная задача дата инженера, на каждом новом этапе вы будете решать часть большой задачи и в финале автоматизируете весь процесс.
Курс основан на практике. Мы рассматриваем инструмент или технологию и сразу на практике ее отрабатываем.
Программа построена по принципу от простого к сложному. Вы узнаете и освоите самое важное о Data Engineering, что нужно знать инженеру данных.
В процессе обучения вам будет помогать преподаватель и команда кураторов, которые помогут разобраться с предметом и решат все технические и организационные вопросы.
Как проходит обучение
Слушаете лекции преподавателей
Вы сможете проходить обучение из любой точки планеты. Новые модули будут открываться раз в неделю
Выполняете практические задания
По каждой теме вы выполняете практику - основанные на реальных кейсах задачи по big data
Помощь преподавателя и коллектива
Вы будете получать поддержку наставников и постоянно общаться со своими сокурсниками в наших каналах в Slack
Итоговый проект
В конце курса вы завершите собственный проект по настройке пайплайнов и хранилища данных
Жизнь на курсе
Уроки с упором на практику

Вы не просто изучаете алгоритмы, а учитесь использовать их в решении реальных бизнес-задач. После обучения сможете сразу использовать навыки машинного обучения в деле, а не разбираться с тем, как приспособить знания к жизни.

Уроки доступны на онлайн платформе, для вдумчивого изучения в любое время.


Помощь преподавателя и коллектива

Если что-то не получается, вы не остаетесь один на один с трудностью. Рядом преподаватель, который поможет разобраться с проблемой.

Учиться в коллективе лучше, когда видишь успехи остальных. Если у кого-то получается лучше, это подстегивает к более активным действиям. Если получается лучше остальных, то вы помогаете коллегам.
Общаемся и помогаем друг другу в Slack

Для курса создается сообщество в Slack. В нем участники делятся впечатлениями и решениями задач, спрашивают совета, а преподаватель всё подробно разъясняет.


Делаем домашние задания

Тут все очевидно: чтобы научиться, нужно практиковаться. Дома вы делаете задания, пишете код, а преподаватель и сокурсники вам в этом помогают.
На курсе обучение не заканчивается
Сертификат о прохождении курса
Помощь с трудоустройством и стажировкой
Готовый код и пайплайны для портфолио
Тусовка специалистов и полезные знакомства
Среди наших студентов сотрудники компаний
Запишитесь на курс со скидкой
Стоимость обучения

currentPrice basePrice
priceComment
идет набор
дата старта
Онлайн
формат обучения
10 недель
длительность курса
Как получить скидку на обучение?
100% оплата курса
В этом случае стоимость обучения будет ниже на 10-20%.
Обучение за счет работодателя
Для запроса документов забронируйте курс через форму и выберите пункт «Оплатить как юр лицо» или напишите на почту info@skillfactory.ru.
Реферальная программа
Вы можете получить скидку 20%, пригласив друзей на наши курсы.
Программа лояльности
После оплаты одного из курсов вы получаете скидку на другой курс.
Быстрая оплата
Внесите предоплату 5000руб в течение 3х дней после регистрации и получите персональную дополнительную скидку.
Репост
Поделитесь ссылкой на курс у себя в соц.сетях и получите дополнительную скидку 5%.
* Если хотите подробнее узнать про скидку, свяжитесь с менеджером
Часто задаваемые вопросы
Что такое Data Engineering?
Задача Data Engineering - сбор, обработка и хранение данных для того, чтобы их могли использовать аналитики и другие сотрудники компании.

Эти накопленные данные используют, например, для машинного обучения и построения прогнозов, для анализа и принятия управленческих решений.
Зачем это мне?
Бизнес-аналитикам часто приходится самостоятельно заниматься процессами сбора данных из разных источников, первоначальной обработкой, очисткой, настройкой пайплайнов.

Если вы работаете Data Scientist, то вы постоянно общаетесь с инженерами данных. Вам нужно знать методы и технологии хранения и доставки данных, чтобы эффективно взаимодействовать с инженерами.
Для кого этот курс
Курс предназначен для бизнес-аналитиков, специалистов Data Science, аналитиков данных, разработчиков, которые хотят научиться выстраивать потоки данных, и менеджеров, руководителей, которым нужно понимать как устроено хранилище данных, как собираются и очищаются данные.
Что потребуется для успешного обучения
Ноутбук с установленным Python (мы дадим инструкцию и поможем с установкой). Около 5-6 часов в неделю и желание получить новые знания. Дополнительно вы будете оплачивать свой аккаунт облачного сервиса Amazon Web Services для выполнения практики (примерно 30-60 долл).
Я стану гуру Data Engineering?
Область Big Data — бесконечная, требующая постоянного самообразования и отслеживания новых технологий. Вы пройдете от точки «я ничего не знаю» до точки «я решаю задачи по Data Engineering и знаю, где это применить и как развиваться дальше».
Чем вы лучше бесплатных курсов
Основной ответ такой — наш курс не является заменой бесплатным онлайн-курсам. Напротив, такие онлайн-курсы — это очень хорошо и полезно. Но у наших курсов есть неоспоримые преимущества: фокус на практике, помощь преподавателя и поддержка группы.

Вы будете учиться по принципу одно занятие = одна задача. Вместе с опытным специалистом по инжинирингу данных вы пройдете все этапы извлечения, обработки, загрузки, хранения, очистки, доставки данных.

Если вы столкнетесь с проблемой при выполнения задания, вам всегда будет, к кому обратиться: вы сможете получить совет от одногруппников и помощь преподавателя в закрытом сообществе в Slack.
Это действительно востребовано?
Да. Убедитесь в этом, посмотрите статистику Data Engineer на русскоязычных и зарубежных кадровых сайтах