Тестовое задание
на аналитика данных
Сбер

Задание #1
Ссылка на задание в папке

Для страницы необходимо подготовить рекомендации для повышения конверсии в подключение услуги в формате:

Рекомендация, % охват пользователей, Объем ресурсов на реализацию и Предполагаемый эффект.

Мы ожидаем от вас файл в формате .doc или .pdf

Задание #2
Ссылка на задание в папке

Шаг 1
Получить доступ к public data внутри BigQuery.
Инструкция по ссылке
Нас интересует набор данных google_analytics_sample и датасет ga_sessions.

Шаг 2
Выгрузить таблицу из BQ (можно через сохранение на Google Drive или BQ API)
Набор полей в Select определить самостоятельно. Период запроса - 2 недели

Шаг 3
с помощью Python сформировать последовательности источников визитов пользователя, которые привели к транзакции.
- Источник определяем как связку utm_source + utm_medium. 
- Транзакция определяется, как hits.transaction.transactionId соответствует регулярному выражению .*\d+.*

Пример:
- Пользователь, который совершил визит с рекламы Яндекса, а затем с рекламы Google и совершил транзакцию будет иметь цепочку
yandex_cpc => google_cpc
- Пользователь совершил переход из поиска Google, а затем из поиска Яндекс. Транзакций не совершал. Цепочка для него отсутствует.
Если не совсем понятно, что такое последовательность касаний для каждого пользователя, то вот обучающее видео.

В результате ожидаем jupiter ноутбук с вашими комментариями и 2-мя результирующими таблицами:

1. Для каждой транзакции сформирована цепочка касаний
2. Топ-10 самых популярных цепочек касаний. Популярность определяется на основе количества таких цепочек в датасете.

Задание #3
Ссылка на задание в папке

Вам предоставлена выгрузка из рекламного кабинета (dataset_task3), который содержит

- Месяц
- Название рекламной кампании
- № рекламной кампании
- Кол-во показов рекламного объявления
- Средняя позиция показа рекламного объявления


Вам необходимо нарисовать слайд для отчетной презентации перед руководством, который иллюстрирует результаты маркетологов в части повышения видимости рекламы.

Вы решили, что основная информация на слайде будет состоять из % показов рекламного объявления на позиции ТОП-1 и ТОП-3 для:

- брендовых рекламных кампаний
- не брендовых рекламных кампаний
- общий для всех рекламных кампаний


Вы знаете, что:
- Определить тип кампании можно по наличию brand в названии кампании. 
- Позиции для показа рекламного объявления в поисковой выдачи ограничены рядом целых чисел от 1 до 8.

Мы ожидаем от вас 1 слайд для презентации в формате pptx или pdf и ноутбук с расчетами.

Задание #4
Ссылка на задание в папке

Таблица представлена следующими полями:
1) key
2) id
3) phone
4) mail

Тестовые данные:
1;12345;89997776655;test@mail.ru
2;54321;87778885566;two@mail.ru
3;98765;87776664577;three@mail
4; 66678;87778885566;four@mail.ru
5; 34567;84547895566;four@mail.ru
6; 34567;89087545678;five@mail.ru

На основании заданного поля (это может быть id, phone, mail) получить все "связанные данные"
Например:

если задать поиск по условию phone = 87778885566;
Результат должен быть следующим:
2;54321;87778885566;two@mail.ru
4; 66678;87778885566;four@mail.ru
5; 34567;84547895566;four@mail.ru
6; 34567;89087545678;five@mail.ru

Задание следует выполнить на python и на SQL (по сути два задания). Диалект SQL можно использовать любой.

Задание #5
Таблица CLIENTS_TABLE (по клиентам)
Таблица LOANS_TABLE (по договорам)

Каждый клиент может обращаться в компанию несколько раз, соответственно в базе может храниться информация по нескольким договорам на одного клиента.

Договор, оформленный клиентом у нас впервые, будем называть первым договором; договор, оформленный после – вторым; далее – третьим; и так далее.

Необходимо написать SQL запрос к базе для последующего представления его результатов в сводной таблице вида:

Диалект SQL можно использовать любой.

Тестовые данные:
drop table LOANS_TABLE;
CREATE TABLE LOANS_TABLE (
LOAN_ID int,
CLIENT_ID int,
LOAN_DATE date,
LOAN_AMOUNT float);

drop table CLIENTS_TABLE;
CREATE TABLE CLIENTS_TABLE (
CLIENT_ID int,
CLIENT_NAME NVARCHAR(20),
BIRTHDAY date,
GENDER NVARCHAR(20));

INSERT INTO CLIENTS_TABLE
VALUES
(1, 'bob', '20200115', 'male'),
(2, 'rocky', '20200215', 'female'),
(3, 'like', '20200215', 'female'),
(4, 'ricky', '20200215', 'male');

INSERT INTO LOANS_TABLE
VALUES
(1, 1, '20200115', 10000),
(2, 2, '20200215', 20000),
(3, 3, '20200315', 30000),
(4, 4, '20200415', 40000),
(5, 1, '20200116', 15000),
(6, 2, '20200315', 35000),
(7, 3, '20200315', 5000),
(8, 1, '20200115', 1500),
(9, 2, '20200115', 500),
(10, 1, '20200115', 1500);

Тестовое задание на аналитика данных в Сбер. Ознакомьтесь с примерами реальных тестовых заданий, которые предлагаются кандидатам. Узнайте, какие задачи могут встретиться и как они связаны с будущей работой. Это поможет лучше подготовиться к собеседованию в Сбер и понять ожидания работодателя.
хочешь поделиться решением или заданием с собеседования?

Оставь свои контакты через форму, и я свяжусь с тобой в течение 24 часов
© No Data No Growth, 2024