Скидки на курсы ждут в личном кабинете. Нажмите тут
Есть рассрочка Поддержка куратора Домашние задания

Математика и Machine Learning для Data Science от SkillFactory

Математика и Machine Learning для Data Science
Формат
Онлайн
Длительность
5.5 месяцев
Уровень
Для новичков
Документ
Сертификат
Трудоустройство
Нет
Программа

Курс полезен для желающих стать специалистом в Machine Learning. Вы освоите линейную и логистическую регрессию, изучите границы применимости, аналитический вывод и регуляризацию. 

Программа длится 5,5 месяцев и состоит из 14 блоков. Курс включает в себя модули: «Основы теории вероятности и статистики», «Временные ряды и прочие математические методы», «Методы предобработки данных» и «Tree-based алгоритмы: ансамбли».

  • Линейная алгебра

    • Изучаем вектора и виды матриц;
    • Учимся проводить операции над матрицами;
    • Определяем линейную зависимость с помощью матриц;
    • Изучаем обратные, вырожденные и невырожденные матрицы;
    • Изучаем системы линейных уравнений, собственные и комплексные числа;
    • Осваиваем матричное и сингулярное разложение;
    • Решаем задачи линейной зависимости с помощью матриц;
    • Оптимизируем с помощью метода главных компонент;
    • Закрепляем математические основы линейной регрессии.
  • Основы матанализа

    • Изучаем функции одной и многих переменных и производные;
    • Осваиваем понятие градиента и градиентного спуска;
    • Тренируемся в задачах оптимизации;
    • Изучаем метод множителей Лагранжа, метод Ньютона и имитацию отжига;
    • Решаем задачи предсказания и поиска выигрышной стратегии с помощью производных и численных методов оптимизации;
    • Закрепляем математические основы градиентного спуска и имитации отжига.
  • Основы теории вероятности и статистики

    • Изучаем общие понятия описательной и математической статистики;
    • Осваиваем комбинаторику;
    • Изучаем основные типы распределений и корреляции;
    • Разбираемся в теореме Байеса;
    • Изучаем наивный байесовский классификатор;
    • Решаем задачи комбинаторики, валидности и прогнозирования методами статистики и теории вероятности;
    • Закрепляем математические основы классификации и логистической регрессии.
  • Временные ряды и прочие математические методы

    • Знакомимся с анализом временных рядов;
    • Осваиваем более сложные типы регрессий;
    • Прогнозируем бюджет с помощью временных рядов;
    • Закрепляем математические основы классических моделей машинного обучения.
  • Введение в машинное обучение

    • Знакомимся с основными задачами и методами machine learning, изучаем практические кейсы и применяем базовый алгоритм работы над ml-проектом;
    • Решаем 50+ задач на закрепление темы.
  • Методы предобработки данных

    • Изучаем типы данных, учимся очищать и обогащать данные, используем визуализацию для предобработки и осваиваем feature engineering;
    • Решаем 60+ задач на закрепление темы.
  • Регрессия

    • Осваиваем линейную и логистическую регрессию, изучаем границы применимости, аналитический вывод и регуляризацию. Обучаем модели регрессии;
    • Решаем 40+ задач на закрепление темы.
  • Кластеризация

    • Осваиваем обучение без учителя, практикуемся в его различных методах, работаем с текстами средствами ML;
    • Решаем 50+ задач на закрепление темы.
  • Tree-based алгоритмы: введение в деревья

    • Знакомимся с решающими деревьями и их свойствами, осваиваем деревья из библиотеки sklearn и используем деревья для решения задачи регрессии;
    • Решаем 40+ задач на закрепление темы.
  • Tree-based алгоритмы: ансамбли

    • Изучаем особенности ансамблей деревьев, практикуемся в бустинге, используем ансамбль для построения логистической регрессии;
    • Решаем 40+ задач на закрепление темы;
    • Участвуем в соревновании на kaggle по обучению tree-based модели.
  • Оценка качества алгоритмов

    • Изучаем принципы разбиения выборки, недо- и переобучение, оцениваем модели по различным метрикам качества, учимся визуализировать процесс обучения;
    • Оцениваем качество нескольких моделей ML;
    • Решаем 40+ задач на закрепление темы.
  • Временные ряды в машинном обучении

    • Знакомимся с анализом временных рядов в ML, осваиваем линейные модели и XGBoost, изучаем принципы кросс-валидации и подбора параметров;
    • Решаем 50+ задач на закрепление темы.
  • Рекомендательные системы

    • Изучаем методы построения рекомендательных систем, осваиваем SVD-алгоритм, оцениваем качество рекомендаций обученной модели;
    • Решаем 50+ задач на закрепление темы.
  • Финальный хакатон

    Применяем все изученные методы для получения максимальной точности предсказаний модели на Kaggle.

Чему научат на курсе
Проводить операции над матрицами
Разбираться в SVD-алгоритме
Разбираться в feature engineering
О школе
SkillFactory
рейтинг 4.3
47 отзывов
68 курсов
SkillFactory

Образовательную платформу SkillFactory создали в 2016 году Александр Турилин и Александр Ерошкин. SkillFactory — онлайн-школа с инженерным профилем. Большинство курсов посвящены темам Data Science, аналитике данных, программированию, а также сфере digital. 

Среди преподавателей и экспертов SkillFactory — сотрудники ведущих российских компаний: Яндекс, Ozon, X5 Retail Group, Lamoda, Вконтакте. Менторы проверяют и комментируют домашние задания студентов, помогают разобраться в темах, если что-то непонятно. С организационными вопросами студенты могут обращаться к координатору курса, а на сайте Скилфактори оставлять отзывы и проходить блиц-опросы.

Оставить отзыв
Оставьте свой отзыв
Так вы сделаете рейтинг школ более точным и поможете другим выбрать хороший курс

Информация носит ознакомительный характер и может отличаться от указанной на сайтах школ-партнёров. Актуальную стоимость и описание программ вы можете узнать на сайте школы.