Для прохождения программы нужны навыки программирования на Python, знания математического анализа и линейной алгебры, знания теории вероятностей и мат. статистики.
На курсе для закрепления навыков с каждым алгоритмом вы будете проводить полный pipeline работ от подготовки датасета до анализа результатов и подготовки к продакшену. После курса вы сможете претендовать на позиции уровня Junior- и Middle-специалиста.
Модуль 1. Продвинутые методы машинного обучения
- Тема 1. Вводный урок. Повторение основных концепций машинного обучения на практическом примере
- Тема 2. Деревья решений
- Тема 3. Python для ML: пайплайны, ускорение pandas, мультипроцессинг
- Тема 4. Ансамбли моделей
- Тема 5. Градиентный бустинг
- Тема 6. Метод опорных векторов
- Тема 7. Методы уменьшения размерности
- Тема 8. Обучение без учителя. K-means, EM алгоритм
- Тема 9. Обучение без учителя. Иерархическая кластеризация. DB-Scan
- Тема 10. Поиск аномалий в данных
- Тема 11. Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
- Тема 12. Алгоритмы на графах
Модуль 2. Сбор данных. Анализ текстовых данных.
- Тема 13. Сбор данных
- Тема 14. Анализ текстовых данных. Часть 1: Предобработка и токенизация
- Тема 15. Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами
- Тема 16. Анализ текстовых данных. Часть 3: Named Entity Recognition
- Тема 17. Анализ текстовых данных. Часть 4: Тематическое моделирование
- Тема 18. Q&A
Модуль 3. Анализ Временных рядов
- Тема 19. Анализ временных рядов. Часть 1: Постановка задачи, простейшие методы. ARIMA-модель
- Тема 20. Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование
- Тема 21. Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций)
Модуль 4. Рекомендательные системы
- Тема 22. Рекомендательные системы. Часть 1: Постановка задачи, метрики качества. Коллаборативная фильтрация. Холодный старт
- Тема 23. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила
- Тема 24. Рекомендательные системы. Часть 3: Implicit feedback
- Тема 25. Практическое занятие по рекомендательным системам. Surpsise
- Тема 26. Q&A
Модуль 5. Дополнительные темы
- Тема 27. Kaggle тренировка по ML №1
- Тема 28. Kaggle тренировка по ML №2
- Тема 29. ML в Apache Spark
- Тема 30. Поиск Data Science работы
Модуль 6. Проектная работа
- Тема 31. Выбор темы и организация проектной работы
- Тема 32. Консультация по проектам и домашним заданиям
- Тема 33. Защита проектных работ