Это файл БД на фреймворке sqlite3. Синтаксис SQL, используемый в данной БД, почти не отличается от ORACLE DB (более подробно).
Запросы к базе можно сохранять сразу в pandas.DataFrame, используя следующий код:
В базе данных хранятся две таблицы: pl и campaign. Ключом для связи этих таблиц является поле client_id.
Описание таблиц
Таблица pl:
-client_id — id клиента -segment — сегмент клиента внутри СМБ (Средний и малый бизнес) -period — период расчёта ЧОД банка от продукта, используемого клиентом -product — продукт -pl — ЧОД в тысячах рублей
Пример:
В периоде "p_1" за продукт "Кредит" с клиента "yxwtZv530y" массового сегмента банк заработал 0.374924 тыс. рублей.
Если в каком-либо периоде информация о клиенте/продукте отсутствует, значит в этот период клиента в банке не было или клиент продуктом не пользовался.
Таблица campaign:
-client_id — id клиента -product — продукт кампании -response — статус отклика на предложение -manager_id — id менеджера, на которого назначен клиент
Задача
1. Посчитать средний ЧОД по продуктам и количество клиентов с продуктом для каждого сегмента в разрезе периодов. 2. Посчитать средний ЧОД и количество клиентов в каждом сегменте в разрезе периодов. 3. Оценить отток клиентов с продуктов в периоде p_2. 4. Посчитать сумму ЧОД, привлечённую каждым менеджером в ходе маркетинговой кампании. 5. Оценить эффективность маркетинговой кампании.
готовишься к СОБЕСАМ на продуктового аналитика?
Мой онлайн-интенсив по подготовке к собеседованиям поможет тебе освоить навык прохождения всех этапов собеседования и получить оффер на 30% больше и в 2 раза быстрее
Тестовое задание на на аналитика данных в ВТБ. Ознакомьтесь с примерами реальных тестовых заданий, которые предлагаются кандидатам. Узнайте, какие задачи могут встретиться и как они связаны с будущей работой. Это поможет лучше подготовиться к собеседованию в ВТБ и понять ожидания работодателя.
хочешь поделиться решением или заданием с собеседования?
Оставь свои контакты через форму, и я свяжусь с тобой в течение 24 часов