Тестовое задание
на бизнес аналитика
Mains Lab

Задание #1
Требуется провести анализ изменения цены лечения в 2022 году относительно 2021 года в медицинской клинике и определить ключевые драйверы изменения цены лечения.

Медицинский кейс - последовательность медицинских услуг, полученных одним застрахованном в одной клинике с интервалом между любыми соседними по дате услугами не более 14 дней. Т.е. между любыми 2-мя соседними услугами в кейсе не должно быть разрыва более 14 дней.

Визит - уникальное сочетание даты оказания услуги, застрахованного. Т.е. один визит - это один день, в который застрахованный побывал в клинике. Если был в одной клинике 2 раза, но в разные дни, то это два визита. Если получал услуги (в любом количестве) в одной клинике в один день, то это один визит.

Обратившийся в месяц - уникальное сочетание месяца оказания услуги и идентификатора пациента


Гипотезы для проверки, приблизительный список:

  • Средняя стоимость обслуживания пациентов изменилась из-за изменения цен на услуги
  • Средняя стоимость обслуживания изменилась из-за изменения интенсивности лечения пациентов
  • Средняя стоимость обслуживания пациентов изменилась из-за изменения поло-возрастной структуры обслуживаемых пациентов
  • Средняя стоимость обслуживания пациентов изменилась из-за изменения структуры оказываемых услуг (раньше были дорогие услуги, теперь дешевые или наоборот)
  • Средняя стоимость обслуживания изменилась из-за изменения среднего количества оказанных услуг на один кейс
  • Другие гипотезы на усмотрение кандидата


Кандидат должен выдвинуть и проверить от 3-х до 6-ти основных гипотез. Проверка каждой гипотезы должна содержать:

  • Формулировку гипотезы
  • Описание (определение) показателей, которые требуется рассчитать для проверки гипотезы
  • Расчет выбранных показателей на доступных данных
  • Вывод о подтверждении или опровержении гипотезы на основе данных и расчет влияния данного фактора на повышение средней стоимости

Также требуется сформулировать 1 или несколько основных показателей, описывающих стоимость лечения, относительно которых будет формулироваться гипотеза. 

Например: показатель “средняя стоимость лечения одного пациента за один месяц” изменился на ХХ% из-за повышения цены на услуги на YY%


Описание данных:

record_id- уникальный идентификатор строки данных
service_date - дата оказания медицинской услуги
service_name - наименование медицинской услуги
service_number - количество услуг
service_amount - сумма выплат (стоимость оказанных услуг в рублях)
insured - уникальный идентификатор пациента
sex_id - пол пациента
age_for_service_date - возраст пациента

Все данные взяты из одной клиники

Требования к результату
  • Инструмент - python-скрипт или jupyter notebook c расчетом
  • Результат должен содержать рассчитанные показатели, указанные в задании + скрипты по их расчету
  • Оцениваться будет корректность формулировки гипотез, правильность расчетов и выводов + оформление отчета
хочешь поделиться решением или заданием с собеседования?

Оставь свои контакты через форму, и я свяжусь с тобой в течение 24 часов
© No Data No Growth, 2024