Требуется провести анализ изменения цены лечения в 2022 году относительно 2021 года в медицинской клинике и определить ключевые драйверы изменения цены лечения.
Медицинский кейс - последовательность медицинских услуг, полученных одним застрахованном в одной клинике с интервалом между любыми соседними по дате услугами не более 14 дней. Т.е. между любыми 2-мя соседними услугами в кейсе не должно быть разрыва более 14 дней.
Визит - уникальное сочетание даты оказания услуги, застрахованного. Т.е. один визит - это один день, в который застрахованный побывал в клинике. Если был в одной клинике 2 раза, но в разные дни, то это два визита. Если получал услуги (в любом количестве) в одной клинике в один день, то это один визит.
Обратившийся в месяц - уникальное сочетание месяца оказания услуги и идентификатора пациента
Гипотезы для проверки, приблизительный список:
- Средняя стоимость обслуживания пациентов изменилась из-за изменения цен на услуги
- Средняя стоимость обслуживания изменилась из-за изменения интенсивности лечения пациентов
- Средняя стоимость обслуживания пациентов изменилась из-за изменения поло-возрастной структуры обслуживаемых пациентов
- Средняя стоимость обслуживания пациентов изменилась из-за изменения структуры оказываемых услуг (раньше были дорогие услуги, теперь дешевые или наоборот)
- Средняя стоимость обслуживания изменилась из-за изменения среднего количества оказанных услуг на один кейс
- Другие гипотезы на усмотрение кандидата
Кандидат должен выдвинуть и проверить от 3-х до 6-ти основных гипотез. Проверка каждой гипотезы должна содержать:
- Формулировку гипотезы
- Описание (определение) показателей, которые требуется рассчитать для проверки гипотезы
- Расчет выбранных показателей на доступных данных
- Вывод о подтверждении или опровержении гипотезы на основе данных и расчет влияния данного фактора на повышение средней стоимости
Также требуется сформулировать 1 или несколько основных показателей, описывающих стоимость лечения, относительно которых будет формулироваться гипотеза.
Например: показатель “средняя стоимость лечения одного пациента за один месяц” изменился на ХХ% из-за повышения цены на услуги на YY%
Описание данных:
record_id- уникальный идентификатор строки данных
service_date - дата оказания медицинской услуги
service_name - наименование медицинской услуги
service_number - количество услуг
service_amount - сумма выплат (стоимость оказанных услуг в рублях)
insured - уникальный идентификатор пациента
sex_id - пол пациента
age_for_service_date - возраст пациента
Все данные взяты из одной клиники
Требования к результату
- Инструмент - python-скрипт или jupyter notebook c расчетом
- Результат должен содержать рассчитанные показатели, указанные в задании + скрипты по их расчету
- Оцениваться будет корректность формулировки гипотез, правильность расчетов и выводов + оформление отчета