ОНТИ Большие Данные и Машинное Обучение 2 Этап задача 4 командная

Финиш 8 января 2021

Вам дается датасет просмотра российских телеканалов с 2018 года. Аудитория измеряется для различного возраста и различной метрики. (TVR и Share) Про метрики подробно описано здесь http://www.nazaykin.ru/MP/tv/audit_tv.htm Поле next_day - техническое, оно нужно, т.к. изначально часы с полуночи до 4х утра относятся к предыдущему дню. Некоторые дни скрыты целиком, необходимо спрогнозировать значения TVR и Share по этим дням по аудитории. Возможно использовать внешние открытые данные, не связанные напрямую с рейтингом передач (прогноз погоды и т.д. но не другие рейтинги) Об использовании внешних данных необходимо явно написать в чате https://t.me/joinchat/AAAAAE1hXkEhodBQBrTG2wс тэгом #задача4 указав то, какие данные используете.

Тренировочная выборка https://drive.google.com/file/d/14C3fWUQk9fuv_BaFFN87ZckAPDDsuFd2/view?usp=sharing

Необходимо спрогнозировать значения для тестовой выборки, в файле указаны колонки с пустыми значениями https://drive.google.com/file/d/1EULSxKCsdmY6XLBbYzXsrX2FBzx1cdCB/view?usp=sharing

необходимо в качестве результата вернуть текстовое представление тестовой выборки с заполненными значениями

Пример решения с генерацией ответа. В качестве решение берется среднее значение за последние 72 часа для данного канала.

Максимальное количество баллов - 5000 Метрика основанная на MSLE https://peltarion.com/knowledge-center/documentation/modeling-view/build-an-ai-model/loss-functions/mean-squared-logarithmic-error-(msle)

https://drive.google.com/file/d/1s3drH_GaMrJanDfPaYl0QvfGI5csjAew/view?usp=sharing



Очки Участник Дата Команда Город Учебное заведение