Тестовое задание
на Data Scientist
A1

Задание #1
Используя исторические данные на листе «Timeseries» (см. Задания_1_2.xlsx), построить модель временного ряда. Спрогнозировать ежедневное поведение ряда в следующие 3 мес. Пояснить выбор метода прогнозирования. Привести оценки качества прогноза.

Задание #2
Используя набор данных на листе «Training» (см. Задания_1_2.xlsx) в качестве обучающей выборки, предсказать значения целевой переменной Target для набора данных на листе «Validate». Пояснить выбор метода. Привести оценки точности и качества предиктивной модели. Построить ROC-кривую. Назвать три наиболее важных предиктора.

Задание #3
Дано:
В пакете для третьего задания три файла


В файле Tariff_plans_change.csv содержатся выборочные данные о транзакциях, связанных с подключениями и отключениями тарифных планов абонентами, которые меняли тарифные планы в первом полугодии 2017 года:

- SUBSCRIBER_ID - условный идентификатор абонента
- TARIFF_PLAN_ID – условный идентификатор тарифного плана
- START_DTTM - дата и время подключения плана
- END_DTTM – дата и время отключения (значение $null$ означает, что план актуален на текущий момент).


В файле Charges.csv содержатся помесячные исторические данные об общих расходах абонентов на мобильную связь:

- SUBSCRIBER_ID - условный идентификатор абонента
- BILL_MONTH – биллинговый период в формате YYYY-MM-01 (например, строки со значением ‘2016-01-01’ содержат данные о расходах и потреблении за январь 2016 года)
- CHARGES – общая сумма счета за услуги связи


В файле Suspended.csv содержатся исторические данные о блокировках абонентов в транзакционной форме:

- SUBSCRIBER_ID - условный идентификатор абонента
- START_DT - дата начала блокировки
- END_DT – дата окончания блокировки (значение $null$ означает, что абонент остается блокированным на текущий момент).
Задание:
Необходимо исследовать следующие вопросы:

1. Направления смен тарифных планов: с каких тарифных планов и на какие шли наибольшие перетоки? Визуализировать потоки миграций на диаграмме.
2. Насколько изменился среднемесячный счет абонентов за период 3 месяца после месяца смены тарифного плана в сравнении с периодом 3 месяца до месяца смены тарифного плана. Какие направления смен тарифных планов характеризовались ростом среднего счета в трехмесячном периоде, а какие – сокращением. Визуализировать результаты на диаграммах.
3. Аналогично п.2, только относительно изменения уровня блокировок: насколько реже или чаще стали попадать в блокировки абоненты после миграции в целом и для каждого направления миграции в отдельности. Для сравнения использовать те же периоды: 3 месяца до месяца смены плана и 3 месяца после месяца смены.

Ход и результаты выполнения заданий оформить в виде презентации. Приложить исходники с кодом.
готовишься к СОБЕСАМ на продуктового аналитика?
Мой онлайн-интенсив по подготовке к собеседованиям поможет тебе освоить навык прохождения всех этапов собеседования и получить оффер на 30% больше и в 2 раза быстрее
Узнать подробнее
хочешь поделиться решением или заданием с собеседования?

Оставь свои контакты через форму, и я свяжусь с тобой в течение 24 часов
© No Data No Growth, 2024