Узнайте о снижении цены

Оставьте ваш email и мы напишем вам когда цена снизится

Факультет Data Engineering

Это обучение рассчитано на 4 четверти, в конце каждой нужно будет сделать курсовой проект, например, хранилище для BI-системы или ETL-пайплайн. Вы научитесь собирать и обрабатывать данные, проектировать хранилища и работать с инфраструктурой.
199 500 ₽
139 650 ₽
стоимость обучения
3879 ₽
за месяц обучения
% Беспроцентная рассрочка на 36 мес.
Добавить в избранное
Узнать о снижении цены
Уровень сложности
для новичков
Длительность
12 мес.
Формат обучения
онлайн
Домашние задания
да
Обратная связь
да
Помощь в трудоустройстве
да
Документ по окончании
диплом

Программа обучения

  • Основное
  • Содержание программы

Программа на 70% состоит из вебинаров, на которых вы не только слушаете, но и общаетесь с преподавателем, задаёте вопросы в режиме реального времени. После курса вы сможете претендовать на должность Data Engineer, инженер дата-центра, DWH-аналитик, инженер пайплайнов данных для машинного обучения (ML Engineer).

Подготовительный блок

Курсы:

  • Git. Базовый курс
I четверть. Сбор и хранение данных

Вы погрузитесь в профессию дата-инженера: познакомитесь с понятием базы данных, научитесь использовать SQL, создавать запросы, программировать на Python. Также познакомитесь с открытыми данными, RESTful и SOAP-сервисами, форматами XML и JSON.

II четверть. Построение хранилищ данных для систем аналитики

Познакомитесь с реляционными и нереляционными базами данных, узнаете, как строить хранилища данных и выбирать архитектуры под конкретную задачу.

III четверть. Распределенные базы данных

В данной четверти вы познакомитесь с инструментами обработки больших массивов данных, в первую очередь с инструментами экосистемы Hadoop: HDFS, Yarn, Hive, Hue, Flume, Cassandra и другими. Вы освоите возможности фреймворка Apache Spark для распределённой обработки неструктурированных и слабоструктурированных данных. В конце четверти познакомитесь с популярным инструментом Apache Airflow для планирования и мониторинга пакетных процессов работы с большими данными.

IV четверть. Real-time обработка данных и инфраструктура

Вы освоите потоковую обработку данных с использованием инструментов Kafka и Spark Streaming. Также освоите практики DevOps, необходимые для работы дата-инженером.

Предметы с индивидуальным выбором даты старта

Курсы вне четверти являются частью основной программы обучения и обязательны к прохождению. Вы можете формировать часть расписания самостоятельно и регулировать интенсивность обучения. На прохождение этих предметов у вас есть 2.5 года с момента покупки обучения в GeekUniversity. Проходите параллельно с четвертями или после года обучения.

Курсы:

  • Подготовка данных для ML Applications
  • Linux. Рабочая станция

Чему научат

Разработка, поддержка и оптимизация пайплайнов обработки данных и машинного обучения на Python и Spark
Знание принципов работы БД (SQL/noSQL) и методологий моделирования
Разработка витрин данных для бизнес-пользователей аналитики
Опыт проектирования аналитических систем хранения и обработки больших данных
Опыт работы с Airflow и другими инструментами для запуска регулярных задач
Опыт работы с пакетной и потоковой выгрузкой данных в аналитическое хранилище

Преимущества курса

4 работы в портфолио
Можно сделать налоговый вычет 13%
Помощь в трудоустройстве
В подарок: «Английский для IT-специалистов» от EnglishDom, ключ от продуктов JetBrains, доступ на 3 месяца к Premium подписке Lingualeo

Отзывы пользователей

Оставить отзыв о курсе

    Оставьте отзыв о курсе

    Ваш адрес e-mail не будет опуликован
    Ваша оценка:
    Ваш отзыв:
    Достоинства:
    Недостатки:
    Имя:
    Email: