Скидки на курсы ждут в личном кабинете. Нажмите тут
Есть рассрочка Поддержка куратора Домашние задания

Data Engineer

от OTUS
Data Engineer
Формат
Онлайн
Длительность
4 месяца
Уровень
Для специалистов
Документ
Сертификат
Трудоустройство
Нет
Программа

На обучение приглашают тех, кто уже имеет опыт работы в сфере Data Science. Новичкам без базовых знаний будет сложно. Курс полезен разработчикам, администраторам СУБД и всем, кто стремится повысить профессиональный уровень, освоить новые инструменты и заниматься интересными задачами в сфере работы с данными.

В результате вы будете иметь представление об основных классах задач инженера данных, инструментах, предназначенных для их решения, а также их преимуществах и особенностях. В качестве выпускного проекта вы реализуете задачи с применением парадигмы Map-Reduce кластера в виде pipeline (Kafka, Spark, Hadoop экосистема) и визуализации результатов.

  • Модуль 1. Data Architecture

    Тема 1. Инженер Данных. Задачи, навыки, инструменты, потребность на рынке

    Тема 2. Архитектура аналитических приложений: базовые компоненты и принципы

    Тема 3. On premises / Cloud solutions

    Тема 4. Автоматизация пайплайнов и оркестрация – 1

    Тема 5. Автоматизация пайплайнов и оркестрация – 2

  • Модуль 2. Data Lake

    Тема 6. Распределенные файловые системы. HDFS / S3

    Тема 7. SQL-доступ к Hadoop. Apache Hive / Presto

    Тема 8. Форматы хранения данных и их особенности

    Тема 9. Разбор ДЗ по 1 кейсу

    Тема 10. Очереди сообщений. Обзор Kafka.

    Тема 11. Выгрузка данных из внешних систем

    Тема 12. Apache Spark – 1

    Тема 13. Apache Spark – 2

  • Модуль 3. DWH

    Тема 14. Аналитические СУБД. MPP-базы данных

    Тема 15. Моделирование DWH – 1. Основы работы с dbt

    Тема 16. Моделирование DWH – 2. Data Vault 2.0

    Тема 17. DevOps практики в Аналитических приложениях. CI + CD

    Тема 18. Разбор ДЗ по 2 кейсу

    Тема 19. Data Quality. Управление качеством данных

    Тема 20. Развертывание BI-решения

    Тема 21. Мониторинг / Метаданные

  • Модуль 4. NoSQL/NewSQL

    Тема 22. NoSQL Хранилища. Wide-column и key-value

    Тема 23. NoSQL Хранилища. Document-oriented

    Тема 24. ELK

    Тема 25. ClickHouse

    Тема 26. Разбор ДЗ по 3 кейсу

  • Модуль 5. MLOps

    Тема 27. Организация и Packaging кода

    Тема 28. Docker и REST-архитектура

    Тема 29. MLFlow + DVC

    Тема 30. Деплоймент моделей

    Тема 31. Разбор ДЗ по 4 кейсу

    Тема 32. Разбор ДЗ по 5 кейсу

  • Модуль 6. Выпускной проект

    Тема 33. Выбор темы и организация проектной работы

    Тема 34. Консультация

    Тема 35. Защита

Чему научат на курсе
Понимание ключевых способов интеграции, обработки, хранения больших данных
Умение работать с компонентами экосистемы Hadoop, распределенными хранилищами и облачными решениями
Практические навыки разработки дата-сервисов, витрин и приложений
Знание принципов организации мониторинга, оркестрации, тестирования
О школе
OTUS
рейтинг 4.7
18 отзывов
101 курс
OTUS

Онлайн-школа OTUS с 2017 года проводит обучение по авторским курсам в сфере IT. Миссия компании в том, чтобы научить IT-специалистов решать сложные задачи, искать интересные проекты, дать возможность присоединиться к профессиональному сообществу для развития отрасли информационных технологий и экономики в целом.

На курсах преподают 400 преподавателей, каждый из которых является экспертом в IT-индустрии. На курсах OTUS обучились более 12 000 человек, которые получили качественные знания, востребованные работодателями во всем современном мире.

Оставить отзыв
Оставьте свой отзыв
Так вы сделаете рейтинг школ более точным и поможете другим выбрать хороший курс

Информация носит ознакомительный характер и может отличаться от указанной на сайтах школ-партнёров. Актуальную стоимость и описание программ вы можете узнать на сайте школы.