На курсе ждут новичков, разработчиков с опытом, а также системных и сетевых администраторов. Здесь вас научат автоматизировать работу с данными, настраивать мониторинги, создавать конвейеры обработки и схемы хранения данных.
Программа состоит из трёх больших модулей: хороший аналитик, data-engineer, ML-engineer. После обучения вы сможете претендовать на позицию инженера данных, ETL-эксперта или MLOps уровня middle.
SQL и получение данных
- Основы баз данных
- Работа с базами данных
- Основы SQL
- Продвинутый SQL
- Углубление в SQL
- Работа с PostgreSQL
- Работа с MongoDB
Data Warehouse
- Введение в хранилища данных
- Проектирование хранилища данных
- Знакомство с Pentaho
- Pentaho как инструмент ETL
- ETL-pro
- Общие рекомендации по разработки ETL
- Смежные темы
- DWH в облаке
Business Intelligence решения и многомерная модель данных
- BI как сердце аналитики
- Многомерные модели
- Real-time отчётность
- Современные подходы
Python
- Основы Python
- Введение в анализ данных на Python
- Статистика в Python
- Предобработка данных
- Feature Selection
Data Lake & Hadoop
- Основы Hadoop
- HDFS
- MapReduce
- MapReduce 2
- Yarn
- Pig & Hive
- HBase & Cassandra
- Кластер. Управление и администрирование
Продвинутые методы работы с данными
- Apache Spark
- Работа со Spark
- Spark SQL
- Продвинутый Spark
- Airflow
- Работа с Airflow
- Продвинутый Airflow
- Dbt как инструмент ETL
Работа с потоковыми данными
- ClickHouse
- Kafka
- Kafka Streams
- Kafka Streams 2
- Spark Streaming
- Spark Streaming 2
Работа с данными в облаке
- Google Cloud Platform — хранение данных
- Spark в GCP
- Managed ETL в GCP
- Обработка real-time данных в GCP
- Поиск инсайтов в данных при помощи ML
- Другие облачные провайдеры
Введение в DS & ML
- Введение в машинное обучение
- Задача классификации
- Задача кластеризации
- Ансамблевые методы решения задачи классификации
- Feature engineering
- Нейронные сети
MLOps
- Зачем нужен DevOps
- Docker и микросервисная архитектура
- K8S
- Орекстраторы
- CI/CD
- Мониторинг
- Инструменты DevOps для обучения ML-моделей
- Deploy ML-моделей