Программы
Подготовка к собеседованиямA/B-тесты для аналитиковML и Causal InferenceA/B-тесты для менеджеровОбучение для команд
Бесплатные материалы
База знаний185+ тестовых заданийRoadmap по A/BЧеклист A/B-тестаОтзывыО проектеОставить заявку
01 / тестовое задание

Мултон:
тестовое задание для аналитика данных

Реальное тестовое с собеседования на Middle Data Analyst: исходный текст задания, как решать и частые ошибки.

02 / оригинальный текст

Текст тестового задания

Исходный текст задания без редактуры — так, как его прислали кандидату.

Данные к заданиюОткрыть данные →

Задание #1

Цель этого задания – показать умение работать с временными рядами. К заданию прилагается файл с выгрузкой продаж, в котором содержатся sell-out данные (продажи из магазина конечному покупателю). В данном конкретном случае – это данные по продажам «Напиток 0.5л.» и «Напиток 1.0л.» в сети ХХ за период 2020-2021 год (не полные года) в г. Москва. В данном случае мы предоставляем агрегацию по всем магазинам сети ХХ в городе Москва. В самой табличке есть такие столбцы как:

ChainName – наименование сети City – город Year_445 – год записи Month_445 – месяц записи Week_445 – неделя записи Producer – производитель Brand – бренд Flavor – вкус PackageSize – размер упаковки Item – количество проданных штук товара Price – средневзвешенная цена продажи DoD – глубина скидки в процентах Regular_Price – регулярная цена Promo_Price – промо цена

Задача

Необходимо построить модель (модели), на основании которой(-ых) можно делать прогноз на две недели вперед по каждому продукту, представленному в данных PackageSize (отдельно для «Напиток 0.5л.» и «Напиток 1.0л.»).

03 / что проверяют

Что проверяет это задание

01

Python

Обработка данных и расчёты: pandas, скрипты, автоматизация.

02

Machine Learning

Базовые модели, признаки и оценка качества.

03

Аналитическое мышление

Как разложить задачу, выбрать подход и обосновать решение.

04 / как решать

Как подойти к решению

  1. 1

    Постройте отдельный недельный ряд для «Напиток 0.5л.» и «Напиток 1.0л.», проверьте непрерывность недель и неполноту 2020–2021.

  2. 2

    Учтите промо как регрессоры: DoD, Promo_Price/Regular_Price и сам факт промо сильно двигают sell-out — без них прогноз промо-недель будет смещён.

  3. 3

    Сравните несколько подходов (сезонная наивная, SARIMAX/Prophet с регрессорами, бустинг на лагах) и выбирайте по ошибке на отложенных последних неделях.

  4. 4

    Дайте прогноз на 2 недели вперёд по каждому SKU и честную оценку качества (MAE/MAPE на out-of-time) с допущениями о будущем промо.

05 / частые ошибки

Частые ошибки

  • Игнорировать промо и цену, моделируя только историю продаж.
  • Утечка будущего: использовать признаки, которых не будет на момент прогноза.
  • Оценивать качество на обучающей выборке, а не на отложенных неделях.
  • Одна модель на оба SKU вместо отдельных.
06 / хороший ответ

Каким должен быть сильный ответ

Хороший ответ — это не просто финальные числа или код. Работодатель должен увидеть, как вы думаете, как проверяете ограничения задачи и как оформляете результат.

  • короткое описание логики решения;
  • промежуточные таблицы, запросы и фильтры;
  • финальные значения по каждому пункту задания;
  • понятные выводы и рекомендации.
07 / похожие задания

Похожие задания

08 / следующий шаг

Разбираешь тестовые, но не уверен в решении?

На интенсиве разбираем реальные кейсы, A/B-секции, метрики, SQL, Python и типовые ошибки кандидатов.