Работа в рамках курсового проекта по анализу тенденций в киноиндустрии. Практическая часть без пояснительной записки, но с подробными комментариями внутри ноутбука.
Цель: провести анализ предложенного датасета, очистить данные, решить задачу регрессии по предсказанию оценки пользователей.
Стек: sklearn, pandas, seaborn, matplotlib, jupyter notebook
Этапы работы: Проверил структуру датасета, очистил данные (удалил/заполнил пропуски);
Преобразовал категориальные признаки, нормализовал числовые признаки, провел разведочный анализ (EDA), сформировал признаки признаков;
Протестировал модели, оптимизировал гиперпараметры, измерил качество на метриках (MAE, RMSE, R²), интерпретировал результаты.
Результат: Провел комплексную работу с данными, построил модели для предсказания оценок пользователей (может быть полезно в контексте построения рекомендательной системы)