Узнайте о снижении цены

Оставьте ваш email и мы напишем вам когда цена снизится

Дата-инженер с нуля до middle

На курсе ждут новичков, разработчиков с опытом, а также системных и сетевых администраторов. Здесь вас научат автоматизировать работу с данными, настраивать мониторинги, создавать конвейеры обработки и схемы хранения данных.
180 000 ₽
108 000 ₽
стоимость обучения
4500 ₽
за месяц обучения
% Беспроцентная рассрочка на 24 мес.
Узнать о снижении цены
Уровень сложности
для новичков
Длительность
12 мес.
Формат обучения
онлайн
Домашние задания
да
Обратная связь
да
Помощь в трудоустройстве
да
Документ по окончании
диплом

Программа обучения

  • Основное
  • Содержание программы

Программа состоит из трёх больших модулей: хороший аналитик, data-engineer, ML-engineer. После обучения вы сможете претендовать на позицию инженера данных, ETL-эксперта или MLOps уровня middle.

SQL и получение данных
  • Основы баз данных
  • Работа с базами данных
  • Основы SQL
  • Продвинутый SQL
  • Углубление в SQL
  • Работа с PostgreSQL
  • Работа с MongoDB
Data Warehouse
  • Введение в хранилища данных
  • Проектирование хранилища данных
  • Знакомство с Pentaho
  • Pentaho как инструмент ETL
  • ETL-pro
  • Общие рекомендации по разработки ETL
  • Смежные темы
  • DWH в облаке
Business Intelligence решения и многомерная модель данных
  • BI как сердце аналитики
  • Многомерные модели
  • Real-time отчётность
  • Современные подходы
Python
  • Основы Python
  • Введение в анализ данных на Python
  • Статистика в Python
  • Предобработка данных
  • Feature Selection
Data Lake & Hadoop
  • Основы Hadoop
  • HDFS
  • MapReduce
  • MapReduce 2
  • Yarn
  • Pig & Hive
  • HBase & Cassandra
  • Кластер. Управление и администрирование
Продвинутые методы работы с данными
  • Apache Spark
  • Работа со Spark
  • Spark SQL
  • Продвинутый Spark
  • Airflow
  • Работа с Airflow
  • Продвинутый Airflow
  • Dbt как инструмент ETL
Работа с потоковыми данными
  • ClickHouse
  • Kafka
  • Kafka Streams
  • Kafka Streams 2
  • Spark Streaming
  • Spark Streaming 2
Работа с данными в облаке
  • Google Cloud Platform — хранение данных
  • Spark в GCP
  • Managed ETL в GCP
  • Обработка real-time данных в GCP
  • Поиск инсайтов в данных при помощи ML
  • Другие облачные провайдеры
Введение в DS & ML
  • Введение в машинное обучение
  • Задача классификации
  • Задача кластеризации
  • Ансамблевые методы решения задачи классификации
  • Feature engineering
  • Нейронные сети
MLOps
  • Зачем нужен DevOps
  • Docker и микросервисная архитектура
  • K8S
  • Орекстраторы
  • CI/CD
  • Мониторинг
  • Инструменты DevOps для обучения ML-моделей
  • Deploy ML-моделей
Дипломный проект

Чему научат

Объяснять архитектуру и структуру базы данных
Создавать процессы обработки данных
Работать с основными инструментами обработки больших данных
Обрабатывать события в режиме реального времени
Строить работающий пайплайн в облачной среде
Навыку data literacy

Преимущества курса

Больше 10 кейсов в портфолио
Помощь в трудоустройстве
Можно сделать налоговый вычет 13%

Отзывы пользователей

Оставить отзыв о курсе

    Оставьте отзыв о курсе

    Ваш адрес e-mail не будет опуликован
    Ваша оценка:
    Ваш отзыв:
    Достоинства:
    Недостатки:
    Имя:
    Email: