Программа курса «Python для анализа данных»
Онлайн
из любой точки мира
25 апреля
дата старта
8 недель
минимальная длительность курса
Python для анализа данных с нуля и через практику
Вы навсегда забудете об Excel и BI системах: вы научитесь автоматизировать рутинные задачи по аналитике, выгружать и обрабатывать большие базы данных за несколько минут с помощью алгоритмов Python и готовых библиотек Pandas.

Python для анализа данных — курс, нацеленный на то, чтобы обучить вас Python с нуля. Мы собрали только те инструменты, которые потребуются вам для решения аналитических задач.
Научитесь работать с Python
Автоматизируйте
работу с отчетами
Получите карьерный рост
Программа курса
Модуль 1
Модуль 1
Изучаем Python для задач аналитики
— Тип задач аналитика, решаемых с Python
— Устанавливаем Python: Anaconda и Jupyter notebook
— Инструменты Python для выгрузки и обработки данных
— Основной синтаксис и типы данных
— Работаем с переменными разных типов
— Создаем код, который выполняется в зависимости от выполнения условий
— Работаем с циклами, то есть пишем код, который может многократно повторять одни и те же действия, но с разными данными
Модуль 2
Модуль 2
Работаем с большими файлами и сложными метриками
— Считаем сложные метрики в больших файлах в формате txt, xls, xlsx
— Создаем и обрабатываем словари (структуры данных, знание которых пригодится не только в этом модуле, но и в разделах, посвященных работе с web-данными)
— Делаем код гибким и оптимизируем с помощью собственноручно написанных функций
Модуль 3
Модуль 3
Введение в Pandas
— Ваш первый аналитический кейс с Pandas
— Работаем с файлами, содержащими миллионы строк с данными (в Excel такой файл даже не откроется!)
— Извлекаем из таблиц данные, соответствующие заданному условию или комплексу условий
— Учимся фильтровать и сортировать данные, вычислять основные статистические показатели, анализировать частотность
Модуль 4
Модуль 4
Преобразование таблиц
— Создаем новые столбцы в уже существующем датафрейме
— Учимся группировать данные по столбцам средствами Pandas
— Применяем стандартные и собственные функции к каждой строке датафрейма
— Группируем данные и создаваем таблицы, содержащие только обобщенную информацию из исходного датасета.
Модуль 5
Модуль 5
Сводные таблицы и аналитика
— Знакомимся с pivot-таблицами и сложной агрегацией средствами Pandas
— Учимся работать со сводными таблицами с несколькими измерениями
— Анализируем предпочтения пользователей киносайта
— Работаем с показателями времени в формате Unixtime
Модуль 6
Модуль 6
Объединение датафреймов
— Объединяем два датафрейма в один на основе содержащейся в них общей информации
— Узнаем подводные камни объединения таблиц и научимся их обходить
— Находим и удаляем из датафрейма строки-дубликаты
— Используем значение not-a-number для отсутствующих количественных данных
— Обогащаем служебную выгрузку новыми данными и составляем рейтинг киноновинок
Модуль 7
Модуль 7
Работа с множеством файлов средствами Pandas
— Учимся получать список имен файлов, хранящихся в заданной папке
— Учимся работать с множеством однотипных файлов с помощью циклов
— Генерируем путь доступа к файлу, включающий последовательность вложенных папок
— Добавляем в существующий датафрейм информацию, полученную из нескольких csv-файлов
Модуль 8
Модуль 8
Работа со временем и датами
— Преобразовываем строку, содержащую информацию о дате и (или) времени, в переменную типа datetime
— Извлекаем из переменной типа datetime информацию о количестве дней, часов, минут, секунд в конкретной дате
— Учимся складывать и вычитать даты
Модуль 9
Модуль 9
Визуализация и отчеты. От Pandas до Plotly
— Научимся использовать встроенные в Pandas графические функции для создания простейших графиков
— Строим гистограммы, линейные графики, heatmap и настраиваем параметры их отображения с помощью библиотек Matplotlib и Seaborne
— Работаем с библиотекой Plotly для создания интерактивных отчетов
Модуль 10
Модуль 10
Словари. Рекурсия
— Устанавливаем значения словаря по умолчанию
— Объединяем в одном датафрейме данные из нескольких текстовых файлов
— Используем рекурсию как альтернативу большому числу вложенных циклов
Модуль 11
Модуль 11
Работа с веб-страницами
— Извлекаем данные из веб-стриниц, не открывая эти страницы в браузере
— Загрузка HTML-страниц в датафрейм
— Учимся работать с API VK и получаем данные из общедоступных профилей пользователей социальной сети Вконтакте
— Систематизируем информацию о работе сообществ VK и выгружаем статистику из группы (список пользователей, их активность, публикации на стене сообщества и т.д.)
Модуль 12
Модуль 12
Изучаем API сервисы Яндекса
— Проходим авторизацию в Яндекс.Метрике
— Настраиваем автоматический мониторинг показателей сайта по данным Яндекс.Метрики
— Создаем запросы, содержащие различные комбинации метрик, группировок и фильтров
— Выгружаем отчеты Яндекс.Метрики любого размера
— Узнаем, как сделать универсальный отчет с любыми совместимыми метриками
— Преобразовываем результаты выгрузки данных, полученных по запросу к Яндекс.Метрике, в Pandas.Dataframe
Модуль 13
Модуль 13
Изучаем API сервисы Google
— Проходим авторизацию и создаем проекты в Google Developers Console
— Создаем запросы к Google Analytics, используя различные комбинации метрик, группировок и фильтров
— Организуем постраничную выгрузку больших отчетов Google Analytics
— Автоматическое обновление токенов для регулярных автоматических выгрузок
Модуль 14
Модуль 14
Строим отчетность с помощью Google Sheets
— Подключаем Google Sheets API и проходим авторизацию для работы с таблицами с помощью API
— Работаем с UTM-метками
— Строим автоматические красивые отчеты в Google Sheets и делимся ими с коллегами
Модуль 15
Модуль 15
Работаем с ошибками и техническими проблемами. Создаем бота в Telegram
— Узнаем, как предусмотреть наличие кривых данных, недоступность сервиса и другие неприятности
— Создаем код, который не прерывает свое выполнение даже при возникновении ошибки
— Настраиваем автоматический запуск скрипта с помощью Планировщика задач Windows
— Создаем Телеграм-бота, умеющего рассылать файлы и сообщения
Модуль 16
Модуль 16
Делаем семантический анализ текстов
— Определяем основу слова и проводим морфологический разбор слов с помощью библиотек для обработки естественного языка (Natural Language Processing)
— Поиск опечаток и близких по значению слов
— Работаем с регулярными выражениями
— Создаем скрипт, определяющий эмоциональную (положительную или отрицательную) окраску текста
Модуль 17
Модуль 17
Экзамен
— Финальный экзамен, получение диплома
25 апреля
дата старта
Онлайн
формат обучения
8 недель
длительность курса
Среди наших студентов сотрудники компаний
Внесите предоплату 5 000₽
Вы забронируете место на курсе со скидкой 20%
по цене 29 900₽ вместо 37 900₽ и получите доступ к предварительному курсу — 2 модуля, 17 уроков, 19 практических работ, 2 домашних задания, доступ к закрытому сообществу в Slack.

Введите свой email:
После ввода email вы будете направлены на страницу оплаты
Нажимая, вы даете согласие на обработку своих персональных данных