Файл Stepik_course_analysis.ipynb
Проблема:
Мало людей, которые начали курс, доходят до конца (success rate 5-10%). Необходимо понять, почему пользователи бросают курс и предсказать, перестанет ли пользователь учиться.
Решение:
— Задача классификации, 2 класса студентов: "закончил курс", "бросил курс".
— Создание модели, которая будет предсказывать на основе активности ученика в течение первых дней, закончит ли он курс.
— Нахождение мест, которые вызывают у учеников трудности и демотивируют продолжать прохождение курса.
Машинное обучение:
Обучение ML-моделей:
— Логистическая регрессия
— Дерево решений
— Метод k-ближайших соседей
Подсчет метрик accuracy, precision, recall, F1-score, ROC AUC и сравнение моделей.