Проверяемая компетенция-
основы статистики/проверка гипотез
Формат решения-
приложить ipynb/ссылку на colab
Задача:Предположим, в ряде городов в определенный период проведен тест:
-
В тестовых городах на веб-сайте пиццы располагаются по популярности
-
Во всех остальных по увеличению цены на пиццу
Тестовый период: 7 апреля - 19 мая
Тестовые города: Пенза, Уфа, Курск, Нижний Тагил, Новокуйбышевск, Орск
Описание датасета:-
Date : дата,
-
CityName : город,
-
OrderSource : источник заказа,
-
mp: мобильное приложение,
-
web: веб-сайт,
-
other - другое,
-
Category: категория товара,
-
rto: выручка после скидок,
-
rto_do: выручка до скидок,
-
cost: затраты на себестоимость товаров,
-
tickets: кол-во заказов,
-
qty - кол-во продуктов,
-
clients_qty - уникальное кол-во клиентов,
-
avg_time - среднее время сессии (только по тем, кто оформил заказ),
-
avg_price - средняя цена.
В исходном датасете данные уже сгруппированы по
Date, CityName, OrderSource, Category. Ссылка на датасет.
Вопросы:1. На какие метрики мог повлиять тест?
2. Сделайте визуальный анализ датасета. Как ведут себя метрики в динамике? Какие распределения в данных?
3. Как можно оценить эффект от теста? Если знаете несколько способов, реализуйте один, а другие опишите письменно.
4. Порассуждайте письменно, какие метрики можно было бы еще оценить, если бы вам были доступны все данные компании.