Узнайте о снижении цены

Оставьте ваш email и мы напишем вам когда цена снизится

Дата-инженер с нуля до middle

На курсе вы получите все необходимые знания и окажетесь одним из первых в профессии инженера данных, пока все учатся на Data Scientists.
200 000 ₽
120 000 ₽ за курс
стоимость обучения
5000 ₽ × 24 мес.
рассрочка
Уровень сложности
для новичков
Длительность
15 мес.
Формат обучения
онлайн
Домашние задания
да
Обратная связь
да
Стажировка
нет
Помощь в трудоустройстве
да
Документ по окончании
диплом

Программа обучения

  • Основное
  • Содержание программы

На курсе ждут новичков, разработчиков с опытом, а также системных и сетевых администраторов. Здесь вас научат автоматизировать работу с данными, настраивать мониторинги, создавать конвейеры обработки и схемы хранения данных.

Программа состоит из трёх больших модулей: хороший аналитик, data-engineer, ML-engineer. После обучения вы сможете претендовать на позицию инженера данных, ETL-эксперта или MLOps уровня middle.

SQL и получение данных
  • Основы баз данных
  • Работа с базами данных
  • Основы SQL
  • Продвинутый SQL
  • Углубление в SQL
  • Работа с PostgreSQL
  • Работа с MongoDB
Data Warehouse
  • Введение в хранилища данных
  • Проектирование хранилища данных
  • Знакомство с Pentaho
  • Pentaho как инструмент ETL
  • ETL-pro
  • Общие рекомендации по разработки ETL
  • Смежные темы
  • DWH в облаке
Business Intelligence решения и многомерная модель данных
  • BI как сердце аналитики
  • Многомерные модели
  • Real-time отчётность
  • Современные подходы
Python
  • Основы Python
  • Введение в анализ данных на Python
  • Статистика в Python
  • Предобработка данных
  • Feature Selection
Data Lake & Hadoop
  • Основы Hadoop
  • HDFS
  • MapReduce
  • MapReduce 2
  • Yarn
  • Pig & Hive
  • HBase & Cassandra
  • Кластер. Управление и администрирование
Продвинутые методы работы с данными
  • Apache Spark
  • Работа со Spark
  • Spark SQL
  • Продвинутый Spark
  • Airflow
  • Работа с Airflow
  • Продвинутый Airflow
  • Dbt как инструмент ETL
Работа с потоковыми данными
  • ClickHouse
  • Kafka
  • Kafka Streams
  • Kafka Streams 2
  • Spark Streaming
  • Spark Streaming 2
Работа с данными в облаке
  • Google Cloud Platform — хранение данных
  • Spark в GCP
  • Managed ETL в GCP
  • Обработка real-time данных в GCP
  • Поиск инсайтов в данных при помощи ML
  • Другие облачные провайдеры
Введение в DS & ML
  • Введение в машинное обучение
  • Задача классификации
  • Задача кластеризации
  • Ансамблевые методы решения задачи классификации
  • Feature engineering
  • Нейронные сети
MLOps
  • Зачем нужен DevOps
  • Docker и микросервисная архитектура
  • K8S
  • Орекстраторы
  • CI/CD
  • Мониторинг
  • Инструменты DevOps для обучения ML-моделей
  • Deploy ML-моделей
Дипломный проект

Чему научат

галочка
Объяснять архитектуру и структуру базы данных
галочка
Создавать процессы обработки данных
галочка
Работать с основными инструментами обработки больших данных
галочка
Обрабатывать события в режиме реального времени
галочка
Строить работающий пайплайн в облачной среде
галочка
Навыку data literacy

Преимущества курса

Больше 10 кейсов в портфолио
Помощь в трудоустройстве
Можно сделать налоговый вычет 13%