Программы
Подготовка к собеседованиямA/B-тесты для аналитиковML и Causal InferenceA/B-тесты для менеджеровОбучение для команд
Бесплатные материалы
База знаний165+ тестовых заданийRoadmap по A/BЧеклист A/B-тестаШаблон дизайна экспериментаОтзывыО проектеОставить заявку
01 / тестовое задание

Doctolib:
тестовое задание для аналитика данных

Реальное тестовое с собеседования на Data Analyst.

Doctolib · Аналитик данных · 2 задания · данные есть
02 / оригинальный текст

Текст тестового задания

Ниже — исходный текст задания без редактуры.

Данные к заданиюОткрыть данные →

Контекст:

Doctolib предоставляет программные решения медицинским специалистам по подписке €129 в месяц. Продажами занимаются внутренние команды, которые связываются с потенциальными клиентами (врачами и другими специалистами).

В рамках этого кейса предполагается, что в конце 2016 года команда продаж получила базу из 300 000 потенциальных клиентов. Эта база не обновлялась и не пополнялась новыми контактами в течение следующего года.

Команда аналитиков Doctolib разработала скоринговую модель, которая присваивает каждому потенциальному клиенту баллы от 0 (наименьшая вероятность стать клиентом) до 100 (наибольшая вероятность). Баллы рассчитываются на основе характеристик клиентов и бизнес-правил, определённых коммерческой командой. Каждое значение и критерий имеет назначенное количество баллов. Модель не обновлялась с момента запуска.

Команда продаж видит как список клиентов, так и присвоенные им баллы. Эта информация используется для приоритизации и увеличения количества новых клиентов

Основные определения:

Prospect (потенциальный клиент): Лицо, с которым может связаться команда продаж.Client (клиент): Потенциальный клиент, с которым подписан договор (есть дата подписи).Bucket (группа): Интервальный диапазон значений скоринга (например, 0–10, 10–20 и т.д.)Meeting Rate (MR): Кол-во встреч / кол-во потенциальных клиентов.Transformation Rate (TR): Кол-во клиентов / кол-во встреч.Signature delay: Разница в днях между датой встречи и датой подписания контракта.

Ссылка на данные

Данные представлены в виде CSV-файлов и включают следующие таблицы:

business_dev: сотрудники команды продажprospects: список потенциальных клиентовscores: скоринговые баллы для каждого клиентаmeetings: встречи между продавцами и потенциальными клиентами (дата встречи)contract_signature_dates: даты подписания контрактов с клиентами

Задание:

В январе 2018 года руководитель отдела продаж обращается к вам, как к аналитику данных Doctolib, чтобы понять, как продвигается эта инициатива.

Ваша задача — провести глубокий анализ данных и ответить на следующие вопросы:

1. Работает ли модель скоринга?

Оцените эффективность модели в прогнозировании вероятности, что потенциальный клиент станет клиентом.Проанализируйте корректность распределения баллов по отдельным признакам: медицинская специальность, возраст, география.

2. Используется ли модель скоринга командой продаж?

По данным о том, кто был контактирован, оцените, использовалась ли модель скоринга.Меняется ли использование скоринга со временем?

3. Есть ли связь между эффективностью продавцов и использованием скоринга?

Можно ли сопоставить показатели конкретных продавцов с уровнем использования скоринга

4. Дополнительные инсайты по данным.

Есть ли что-то важное, что вы можете заметить при работе с данными?

5. Потенциальный эффект от более активного использования скоринга:

Какую методологию вы бы предложили для оценки влияния повышения использования скоринга на число клиентов и выручку?Примените эту методологию и дайте предварительную оценку.

6. Презентация для руководства (1 слайд):

Кратко сформулируйте доводы, которые помогут убедить команду продаж активнее использовать скоринг.

Ожидаемые результаты:

Презентация (на английском, но можно на французском), рассчитанная на 20 минут (10–15 слайдов максимум). Презентация должна быть подготовлена до встречи с руководителем отдела продаж, он ознакомится с ней заранее.Код, SQL-запросы и визуализации, которые использовались для анализа.

03 / как решать

Как подойти к решению

Сначала выпишите, что именно просят посчитать и в каких разрезах. Затем сверьтесь с данными: какие листы/таблицы есть, какой период, какие фильтры. Решайте по шагам и фиксируйте допущения — на собеседовании ценят ход мысли, а не только финальную цифру.

04 / частые ошибки

На что обратить внимание

  • Неверный период или единицы измерения.
  • Не учтены фильтры/сегменты из условия.
  • Нет выводов и рекомендаций — только числа.
05 / следующий шаг

Хочешь разбирать такие задания увереннее?

На интенсиве разбираем реальные кейсы, A/B-секции, метрики, SQL и типовые ошибки кандидатов.

Смотреть интенсив →
06 / похожие задания

Похожие задания