Курс по Data Engineering

Практический курс по одному из самых перспективных направлений в Big Data
Онлайн
из любой точки мира
17 июля
дата старта
10 недель
длительность курса
Научитесь строить пайплайны данных в реальном времени
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или модели прогнозирования. Data Engineer - это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.

Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.

Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python. За два месяца вы освоите все важные этапы Data Engineering.
Забронируйте место на курсе сегодня
и получите скидку на обучение

Преподаватель
Дмитрий Аношин
Data Engineer
(Amazon*)
Cпикер различных конференций:
● Amazon Tableau User Group
Enterprise Data World 2018
AWS User Group
Math Marketing Summit 2018
Автор книг:
Mastering Business Intelligence with Microstrategy 10
SAP Lumira Essentials
Learning Hunk
Tableau Cookbook 2019.x
* Данный курс не спонсирован компанией Amazon, содержание программы — личное мнение автора.

Курс из специализации Data Scientist

Курс по Data Engineer
Data-driven management
Python
Math&Stat
Machine
Learning

Deep
Learning

Data
Engineering

Менеджмент
Программа курса
Модуль 1
Модуль 1
Введение в Data Engineering
Рассмотрим типовые архитектуры аналитических решений.
Модуль 2
Модуль 2
Базы данных SQL
Познакомимся с базами данных, и поймем их преимущество для работы с данными по сравнению с Excel.
Модуль 3
Модуль 3
Архитектура корпоративного хранилища данных
Создадим AWS account, запустим кластер Redshift и загрузим в него данные, используя SQL
Модуль 4
Модуль 4
Оптимизация хранилища данных
Рассмотрим важные аспекты оптимизации MPP-решений.
Модуль 5
Модуль 5
Интеграция данных и создание потоков данных (data piplelines)
Рассмотрим ETL-решения и сравним их с ELT. Автоматизируем процесс загрузки данных в Redshift.
Модуль 6
Модуль 6
Выбор и подключение Business Intelligence
Подключим Tableau к нашему хранилищу данных.
Модуль 7
Модуль 7
Знакомство с Apache Spark
Создадим RDD и Data Frame, рассмотрим основные операции и кейсы использования.
Модуль 8
Модуль 8
Создание решения для Big Data с использованием Hadoop и Spark
Решаем задачу по обработке неструктурированные логов с помощью PySpark на Amazon Elastic Map Reduce.
Модуль 9
Модуль 9
Data Lake
Знакомимся с понятием озера данных и используем решения на AWS.
Модуль 10
Модуль 10
Решение задачи по стримингу данных
Создаем поток данных (data pipe line) в реальном времени.
Получить программу
А также подробный план развития в области Data Engineering
Преимущества курса
Курс предназначен для людей, которым нужно освоить основные инструменты и методы по работе с Big Data. Программа рассчитана на тех, кто знаком с Python.
Курс основан на практике. Мы рассматриваем инструмент или технологию и сразу на практике пытаемся ее использовать.
Программа построена по принципу от простого к сложному. Вы узнаете и освоите самое важное о Data Engineering, что нужно знать аналитику данных.
В процессе обучения вам будет помогать преподаватель и координаторы. Они помогут в тех местах, где вы замедлились, и будут отвечать на вопросы.
Как проходит обучение
Слушаете лекции преподавателей
Вы сможете проходить обучение из любой точки планеты. Новые модули будут открываться раз в неделю
Выполняете практические задания
По каждой теме вы выполняете практику - основанные на реальных кейсах задачи по big data
Помощь преподавателя и коллектива
Вы будете получать поддержку наставников и постоянно общаться со своими сокурсниками в наших каналах в Slack
Итоговый проект
В конце курса вы завершите собственный проект по настройке пайплайнов и хранилища данных
Жизнь на курсе
Уроки с упором на практику

Вы не просто изучаете алгоритмы, а учитесь использовать их в решении реальных бизнес-задач. После обучения сможете сразу использовать навыки машинного обучения в деле, а не разбираться с тем, как приспособить знания к жизни.

Уроки доступны на онлайн платформе, для вдумчивого изучения в любое время.


Помощь преподавателя и коллектива

Если что-то не получается, вы не остаетесь один на один с трудностью. Рядом преподаватель, который поможет разобраться с проблемой.

Учиться в коллективе лучше, когда видишь успехи остальных. Если у кого-то получается лучше, это подстегивает к более активным действиям. Если получается лучше остальных, то вы помогаете коллегам.
Общаемся и помогаем друг другу в Slack

Для курса создается сообщество в Slack. В нем участники делятся впечатлениями и решениями задач, спрашивают совета, а преподаватель всё подробно разъясняет.


Делаем домашние задания

Тут все очевидно: чтобы научиться, нужно практиковаться. Дома вы делаете задания, пишете код, а преподаватель и сокурсники вам в этом помогают.
На курсе обучение не заканчивается
Сертификат о прохождении курса
Помощь с трудоустройством и стажировкой
Готовый код и пайплайны для портфолио
Тусовка специалистов и полезные знакомства
Среди наших студентов сотрудники компаний
Запишитесь на курс
Стоимость обучения

currentPrice basePrice
priceComment


Можно в рассрочку на 12 месяцев
installmentPrice в месяц
Рассрочка от Яндекс.Кассы → Подробнее
10 июня
дата старта
Онлайн
формат обучения
10 недель
длительность курса
Как получить курс дешевле?
Оплатите курс целиком
При оплате курса целиком вы экономите
10-20%
Обучение за счет работодателя
У нас есть возможность оплаты обучения работодателем. Для запроса документов заполните форму или напишите на почту
Реферальная программа
Вы можете получить скидку 20%, пригласив друзей на наши курсы.
Программы лояльности
После оплаты одного из курсов вы получаете скидку на другой курс
Быстрая оплата
Внесите предоплату за курс в размере 5000руб в течение 3х дней после регистрации и получите скидку
Репост
Поделитесь ссылкой на курс у себя в соц.сетях и получите скидку 5%
* Подробности уточняйте у менеджера
Часто задаваемые вопросы
Что такое Data Engineering?
Задача Data Engineering - сбор, обработка и хранение данных для того, чтобы их могли использовать аналитики и другие сотрудники компании.

Эти накопленные данные используют, например, для машинного обучения и построения прогнозов, для анализа и принятия управленческих решений.
Зачем это мне?
Бизнес-аналитикам часто приходится самостоятельно заниматься процессами сбора данных из разных источников, первоначальной обработкой, очисткой, настройкой пайплайнов.

Если вы работаете Data Scientist, то вы постоянно общаетесь с инженерами данных. Вам нужно знать методы и технологии хранения и доставки данных, чтобы эффективно взаимодействовать с инженерами.
Для кого этот курс
Курс предназначен для бизнес-аналитиков, специалистов Data Science, аналитиков данных, разработчиков, которые хотят научиться выстраивать потоки данных, и менеджеров, руководителей, которым нужно понимать как устроено хранилище данных, как собираются и очищаются данные.
Что потребуется для успешного обучения
Ноутбук с установленным Python (мы дадим инструкцию и поможем с установкой). Около 5-6 часов в неделю и желание получить новые знания. Дополнительно вы будете оплачивать свой аккаунт облачного сервиса Amazon Web Services для выполнения практики (примерно 30-60 долл).
Я стану гуру Data Engineering?
Область Big Data — бесконечная, требующая постоянного самообразования и отслеживания новых технологий. Вы пройдете от точки «я ничего не знаю» до точки «я решаю задачи по Data Engineering и знаю, где это применить и как развиваться дальше».
Чем вы лучше бесплатных курсов
Основной ответ такой — наш курс не является заменой бесплатным онлайн-курсам. Напротив, такие онлайн-курсы — это очень хорошо и полезно. Но у наших курсов есть неоспоримые преимущества: фокус на практике, помощь преподавателя и поддержка группы.

Вы будете учиться по принципу одно занятие = одна задача. Вместе с опытным специалистом по инжинирингу данных вы пройдете все этапы извлечения, обработки, загрузки, хранения, очистки, доставки данных.

Если вы столкнетесь с проблемой при выполнения задания, вам всегда будет, к кому обратиться: вы сможете получить совет от одногруппников и помощь преподавателя в закрытом сообществе в Slack.
Это действительно востребовано?
Да. Убедитесь в этом, посмотрите статистику Data Engineer на русскоязычных и зарубежных кадровых сайтах