Программы
Подготовка к собеседованиямA/B-тесты для аналитиковML и Causal InferenceA/B-тесты для менеджеровОбучение для команд
Бесплатные материалы
База знаний165+ тестовых заданийRoadmap по A/BЧеклист A/B-тестаШаблон дизайна экспериментаОтзывыО проектеОставить заявку
01 / тестовое задание

JetLend:
тестовое задание для аналитика данных

Реальное тестовое с собеседования на Data Analyst.

JetLend · Аналитик данных · 10 заданий · данные есть
02 / оригинальный текст

Текст тестового задания

Ниже — исходный текст задания без редактуры.

Данные к заданиюОткрыть данные →

В корзине 85 чёрных мячей и 15 красных. Вы наугад достаёте мяч из корзины, фиксируете результат и возвращаете его обратно.

Задание:

Оцените 95%-доверительный интервал количества вытянутых красных мячей, если повторить опыт 100 раз. В качестве ответа укажите левую (наименьшую) границу доверительного интервала, округлённую до целого значения вниз.

Пример 12.5923 -> ответ 12

Задание #2

Дано:

Группа из 40 туристов прибывает в сувенирный магазин.

В магазине обширный выбор из 400 различных позиций, при том в каждой позиции число товаров достаточно, чтобы обслужить всех клиентов. Известно, что каждый турист купил по одному сувениру.

Задание:

Считая выбор туриста равновероятным и независимым, определите вероятность того, что, как минимум два туриста выбрали одинаковые товары. В качестве ответа необходимо указать целое число процентов, округлённое вниз.

Пример: 6.612331% -> ответ 6

Задание #3

Дано:

Вам предлагается сыграть в игру: крупье бросает игральную шестигранную кость (грани пронумерованы от 1 до 6, выпадение каждой грани равновероятно). Результатом броска является ваш выигрыш - цифра на кости х 100р, соответственно если выпала единица - выигрыш 100р, если шестёрка - 600р.

Если результат выпадения кубика вас не устроил, то в рамках одной игры вы можете перебросить его N раз, при этом в случае перебрасывания, вы отказываетесь от предыдущего результата.

Задание:

Рассчитайте минимальное необходимое число возможных перебрасываний N в игре, чтобы игра была статистически выигрышной при условии входной ставки - 475р и использовании вами оптимальной стратегии.

Задание #4

Дано:

Для решения следующих заданий потребуется взаимодействие с данными из следующих файлов: investor_cashflow.xlsx и loan_status.xlsx

Описание данных:

investor_cashflow представляет из себя таблицу операций (инвестирование средств в займ, последующие выплаты процентов заёмщиком в пользу инвестора) начиная с инвестиции суммы в займ (отрицательное значение amount) и заканчивая последней совершённой выплатой согласно графику платежей (положительные значения amount).

Все займы имеют аннуитетную структуру платежей.

Описание полей:

investor_id - идентификатор инвестораdate - дата операцииloan_id - идентификатор займаamount - сумма займаprincipal_payment - часть платежа в погашение основного долгаinterest_payment - часть платежа в погашение процентовloan_status - таблица с условиями по займам и их статус на момент окончания наблюдений (01.02.2024).

Описание полей:

loan_id - идентификатор займаloan_rate - годовая процентная ставка по займуamount - общая сумма займаterm - срок займа (дней)status - статус займа на момент окончания наблюдений: active - активен, closed - завершён, default - дефолтstart_date - дата выдачи займаdate_of_default - дата дефолта, если такое событие произошло

Задание:

1 задание

Необходимо рассчитать число активных займов в портфелях инветоров. В качестве ответа нужно предоставить разницу по модулю этих значений между инвесторами с id = 1 и id = 3.

2 задание

Необходимо рассчитать, какую долю от общей суммы каждого займа составляет инвестиция каждого конкретного инвестора.

Среди рассчитанных значений получить среднее значение среди всех, а также максимальное значение для займа с id = 3.

В качестве ответа предоставить разницу по модулю двух полученных выше значений (среднего из всех и максимального по займу с id = 3), умножить на 10 000 и взять от полученного числа целую часть

3 задание

Фактические суммы дохода / потерь инвестора рассчитываются следующим образом: в качестве дохода берётся сумма процентных платежей, а в качестве потерь - неоплаченный остаток долга в случае, если произошёл дефолт.

Относительное значение можно получить путём деления рассчитанной суммы на общую сумму инвестированных в займы средств инвестора. В настоящем задании необходимо рассчитать относительное значение дохода (или потерь) инвесторов на конец дня 01.03.2023 по каждому.

Для корректности расчёта стоит обратить внимание на указанную дату, так как часть дефолтов ещё не реализовалась к указанной дате, денежные средства инвесторов ещё не были проинвестированы в займы, выданные после этой даты, а процентный доход после указанной даты не был получен инвестором.

В качестве ответа необходимо указать разницу по модулю между максимальным и минимальным значениями относительной доходности инвесторов, умножить на 10 000 и использовать для ответа целую часть.

03 / как решать

Как подойти к решению

Сначала выпишите, что именно просят посчитать и в каких разрезах. Затем сверьтесь с данными: какие листы/таблицы есть, какой период, какие фильтры. Решайте по шагам и фиксируйте допущения — на собеседовании ценят ход мысли, а не только финальную цифру.

04 / частые ошибки

На что обратить внимание

  • Неверный период или единицы измерения.
  • Не учтены фильтры/сегменты из условия.
  • Нет выводов и рекомендаций — только числа.
05 / следующий шаг

Хочешь разбирать такие задания увереннее?

На интенсиве разбираем реальные кейсы, A/B-секции, метрики, SQL и типовые ошибки кандидатов.

Смотреть интенсив →
06 / похожие задания

Похожие задания