Скидки на курсы ждут в личном кабинете. Нажмите тут
Есть рассрочка Поддержка куратора Домашние задания

Дата-инженер с нуля до middle

Дата-инженер с нуля до middle
Формат
Онлайн
Длительность
15 месяцев
Уровень
Для новичков
Документ
Диплом
Трудоустройство
Да
Программа

На курсе ждут новичков, разработчиков с опытом, а также системных и сетевых администраторов. Здесь вас научат автоматизировать работу с данными, настраивать мониторинги, создавать конвейеры обработки и схемы хранения данных.

Программа состоит из трёх больших модулей: хороший аналитик, data-engineer, ML-engineer. После обучения вы сможете претендовать на позицию инженера данных, ETL-эксперта или MLOps уровня middle.

  • SQL и получение данных

    • Основы баз данных
    • Работа с базами данных
    • Основы SQL
    • Продвинутый SQL
    • Углубление в SQL
    • Работа с PostgreSQL
    • Работа с MongoDB
  • Data Warehouse

    • Введение в хранилища данных
    • Проектирование хранилища данных
    • Знакомство с Pentaho
    • Pentaho как инструмент ETL
    • ETL-pro
    • Общие рекомендации по разработки ETL
    • Смежные темы
    • DWH в облаке
  • Business Intelligence решения и многомерная модель данных

    • BI как сердце аналитики
    • Многомерные модели
    • Real-time отчётность
    • Современные подходы
  • Python

    • Основы Python
    • Введение в анализ данных на Python
    • Статистика в Python
    • Предобработка данных
    • Feature Selection
  • Data Lake & Hadoop

    • Основы Hadoop
    • HDFS
    • MapReduce
    • MapReduce 2
    • Yarn
    • Pig & Hive
    • HBase & Cassandra
    • Кластер. Управление и администрирование
  • Продвинутые методы работы с данными

    • Apache Spark
    • Работа со Spark
    • Spark SQL
    • Продвинутый Spark
    • Airflow
    • Работа с Airflow
    • Продвинутый Airflow
    • Dbt как инструмент ETL
  • Работа с потоковыми данными

    • ClickHouse
    • Kafka
    • Kafka Streams
    • Kafka Streams 2
    • Spark Streaming
    • Spark Streaming 2
  • Работа с данными в облаке

    • Google Cloud Platform — хранение данных
    • Spark в GCP
    • Managed ETL в GCP
    • Обработка real-time данных в GCP
    • Поиск инсайтов в данных при помощи ML
    • Другие облачные провайдеры
  • Введение в DS & ML

    • Введение в машинное обучение
    • Задача классификации
    • Задача кластеризации
    • Ансамблевые методы решения задачи классификации
    • Feature engineering
    • Нейронные сети
  • MLOps

    • Зачем нужен DevOps
    • Docker и микросервисная архитектура
    • K8S
    • Орекстраторы
    • CI/CD
    • Мониторинг
    • Инструменты DevOps для обучения ML-моделей
    • Deploy ML-моделей
  • Дипломный проект

Чему научат на курсе
Объяснять архитектуру и структуру базы данных
Создавать процессы обработки данных
Работать с основными инструментами обработки больших данных
Обрабатывать события в режиме реального времени
Строить работающий пайплайн в облачной среде
Навыку data literacy
О школе
Нетология
рейтинг 4.4
59 отзывов
291 курс
Нетология

Образовательную онлайн-платформу «Нетология» основали в 2011 году Юлия Спиридонова и Максим Спиридонов. В Нетологии верят, что у каждого студента есть талант, и помогают выбрать траекторию развития для достижения больших результатов в профессии.

Каждый курс содержит актуальную информацию и соответствует отраслевым трендам. Этому способствует и опыт преподавателей, которые являются сотрудниками ведущих российских компаний, в числе которых Яндекс, Сбер, ВТБ, Авито. Также во время обучения студентов поддерживают кураторы.

Оставить отзыв
Оставьте свой отзыв
Так вы сделаете рейтинг школ более точным и поможете другим выбрать хороший курс

Информация носит ознакомительный характер и может отличаться от указанной на сайтах школ-партнёров. Актуальную стоимость и описание программ вы можете узнать на сайте школы.