Тестовое задание Mains Lab для аналитика данных

Текст тестового задания

Исходный текст задания без редактуры — так, как его прислали кандидату.

Задание #1

Требуется с помощью анализа данных найти потенциальное мошенничество со стороны клиники в оказанных медицинских услугах по ДМС.

Что такое мошенничество: систематическое искажение информации в реестре оказанных медицинских услуг с целью получения прибыли.

»клиника один раз выставила выставила услугу за 2000 рублей вместо услуги за 1000 рублей» - не мошенничество, т.к. нет системности;

»клиника назначила и провела исследование тиреотропного гормона при диагнозе простуда (данный анализ при данном диагнозе не нужен)» - не мошенничество, т.к. услуга реально была проведена и диагноз был поставлен корректно - нет искажения информации и нет системности;

«каждому пришедшему пациенту клиника приписывает услугу тестирование на COVID вне зависимости от того, был ли реально проведен тест» - мошенничество, т.к. есть системность и искажение информации.

Описание данных

row_id - уникальный идентификатор строки данных butch_id – уникальный идентификатор счета service_id – уникальный идентификатор медицинской услуги service_name - наименование медицинской услуги service_quantity - количество медицинских услуг service_date - дата оказания медицинской услуги service_amount - сумма выплат (стоимость оказанных услуг в рублях) icd_codes – коды диагнозов МКБ-10 застрахованного по медицинской услуге insured_id - уникальный идентификатор застрахованного insured_age – возраст застрахованного insured_gender – пол застрахованного provider_id – уникальный идентификатор клиники service_code – код проклассифицированной медицинской услуги service_code_name – наименование проклассифицированной медицинской услуги

Требования к результату

Инструмент - python-скрипт или jupyter notebook c расчетом + файл requirements.txt.;

Результат должен содержать код для поиска мошенничества + результат обработки выборки данных с помощью скрипта + текстовое обоснование, почему отмеченные скриптом кейсы являются подозрительными;

Оцениваться будет корректность формулировки гипотезы, правильность расчетов и выводов + оформление отчета;

Обязательное требование к результату - найти хотя бы одну потенциально мошенническую схему/паттерн в данных. Т.е. если вы проверили 10 идей и ни одна не подтвердилась (не нашлось кейсов с данными видом мошенничества) - это плохой результат.

Что проверяет это задание

Python

Обработка данных и расчёты: pandas, скрипты, автоматизация.

Продуктовый кейс

Разложить задачу, выбрать метрики и сделать выводы.

Аналитическое мышление

Как разложить задачу, выбрать подход и обосновать решение.

Как подойти к решению

Разберите условие: что именно просят посчитать и в каких разрезах.

Сверьтесь с данными: какие таблицы есть, период и нужные фильтры.

Решайте по шагам и фиксируйте промежуточные результаты и допущения.

Доведите до финальных чисел и коротких выводов или рекомендаций.

Частые ошибки

Неверный период, разрез или единицы измерения.
Не учтены фильтры и сегменты из условия.
Решение без промежуточных шагов — только финальная цифра.
Нет выводов и рекомендаций по результату.

Каким должен быть сильный ответ

Хороший ответ — это не просто финальные числа или код. Работодатель должен увидеть, как вы думаете, как проверяете ограничения задачи и как оформляете результат.

короткое описание логики решения;
промежуточные таблицы, запросы и фильтры;
финальные значения по каждому пункту задания;
понятные выводы и рекомендации.

Mains Lab:
тестовое задание для аналитика данных

Текст тестового задания

Задание #1

Что проверяет это задание

Python

Продуктовый кейс

Аналитическое мышление

Как подойти к решению

Частые ошибки

Каким должен быть сильный ответ

Похожие задания

Mains Lab:тестовое задание для аналитика данных

Текст тестового задания

Задание #1

Что проверяет это задание

Python

Продуктовый кейс

Аналитическое мышление

Как подойти к решению

Частые ошибки

Каким должен быть сильный ответ

Похожие задания

Хочешь больше таких разборов?

Разбираешь тестовые, но не уверен в решении?

Mains Lab:
тестовое задание для аналитика данных