-
-
Notifications
You must be signed in to change notification settings - Fork 5.7k
About the course (in Russian)
Анонс курса на Хабре. Youtube-канал c онлайн-трансляциями и записями лекций. Курс обсуждается в Slack OpenDataScience в канале #mlcourse_open, объявления – в группе ВКонтакте.
Цель курса – развить понимание основных концепций машинного обучения (теория) и дать навыки его использования (практика). Поэтому статьи не без математики и поэтому в курсе множество активностей: домашние задания, соревнования на Kaggle Inclass, слушатели сами пишут тьюториалы по интересным темам и выполняют индивидуальные проекты.
Требуются начальные навыки программирования на Python и знание математики (математический анализ, линейная алгебра, теория вероятностей, математическая статистика) на уровне 2 курса технического ВУЗа. Подробнее – в Wiki репозитория.
- Первичный анализ данных с Pandas
- Визуальный анализ данных с Python
- Классификация, деревья решений и метод ближайших соседей
- Линейные модели классификации и регрессии
- Композиции: бэггинг, случайный лес
- Построение и отбор признаков
- Обучение без учителя: PCA и кластеризация
- Обучаемся на гигабайтах с Vowpal Wabbit
- Анализ временных рядов с помощью Python
- Градиентный бустинг
- Первичный анализ данных с Pandas
- Визуальный анализ данных с Seaborn и Matplotlib
- Классификация. Деревья решений
- Логистическая регрессия + обсуждение соревнования Kaggle
- Случайный лес
- Регрессия, регуляризация
- Обучение без учителя
- Признаки, SGD, Vowpal Wabbit
- Временные ряды
- Градиентный бустинг
Актуальные задания будут объявляться раз в неделю при очередной сессии курса. Тут вы найдете демо-версии заданий:
- Анализ данных по доходу населения UCI Adult, nbviewer
- Визуальный анализ данных о публикациях на Хабрахабре, nbviewer
- Деревья решений в игрушечной задаче и на данных Adult репозитория UCI, nbviewer
- Прогнозирование популярности статей на TechMedia (Хабр) с помощью линейных моделей, nbviewer
- Логистическая регрессия и случайный лес в задаче кредитного скоринга, nbviewer
- Линейная регрессия, Lasso и RF-регрессия в задаче по определению качества вина, nbviewer
- Обучение без учителя: метод главных компонент и кластеризация, nbviewer
- Реализация алгоритмов онлайн-обучения, nbviewer
- Анализ временных рядов, nbviewer
- Прогнозирование задержек вылетов (соревнование Kaggle Inclass), nbviewer
- Catch Me If You Can: Intruder Detection through Webpage Session Tracking. Kaggle Inclass
- How good is your Medium article? Kaggle Inclass
- Категоризация покупок. Kaggle Inclass, ссылка для участия
- Из чего состоит курс. Тут собраны активности, за которые можно получить баллы в 3-ей сессии этого курса (с 5 февраля по 20 апреля 2018 г)
- Prerequisites: Python, математика, DevOps. О том, как лучше подготовиться к прохождению курса, если навыков программирования или знаний математики не хватает.
- План совместного прохождения курса cs231n c 23.04.2018
- Авторы статей и лекторы. Вкратце представляем всех, кто поработал над курсом.
- ПО для прохождения курса и Docker – как настроить все ПО для прохождения курса. В частности, описывается, как запустить у себя Docker-контейнер, в котором уже все установлено.
- Топ-100 1-ой сессии курса. 1-я сессия курса прошла с 28 февраля по 10 июня 2017 года – с домашними заданими, соревнованиями, тьюториалами, конкурсами по визуализации и общим рейтингом. Более 500 участников.
- Топ-100 2-ой сессии курса. 2-я сессия курса прошла с 6 сентября по 17 ноября 2017 года – добавились индивидуальные проекты. Более 1300 участников.
- Тьюториалы и проекты. Одним из заданий в курсе было написать тьюториал на одну из тем вокруг машинного обучения и анализа данных и выполнить индивидуальный проект по предложенному плану.
Поддержать курс можно на краудфандинговой платформе Patreon