Тестовое задание Градус для инженера данных

02 / оригинальный текст

Текст тестового задания

Исходный текст задания без редактуры — так, как его прислали кандидату.

Задание #1

На основе анализа колонок 1,2,3 проставить в колонки бренд и подбренд товара. Если, что-то не указано или невозможно определить - проставить «Не указан»

Результат работы: колонки 4 и 5 заполнены. Пояснительная записка: что и как делалось, скрипты на Python, если использовался.

Задание со звездочкой (необязательное): продумать более общий подход для этой работы, когда исходные данные это наименования других групп товаров.

1.задание_на_лемматизацию.xlsx

Задание #2

В базе данных address есть таблица a.

В этой таблице в некоторых строках значение поля [код ТТВх] NULL (таких строк 6353) Требуется написать команды SQL, чтобы заполнить это поле.

Возможно в этом поможет таблица b.

Задание #3

Вводные: retailer - название ритейлера, cat - название группы, subcat - название подгруппы, year_month - год и месяц, week - неделя, cnt_lines - количество строк, cnt_stores - количество уникальных магазинов, cnt_sku - количество уникальных товаров (SKU) si - суммарные продажи в шт., sv - суммарные продажи в руб.

Проанализировать файл со сводной статистикой (statistics.txt) на возможные недочёты по качеству данных и полноте данных.

Описать недочёты, если будут выявлены.

Дополнительно* (но не обязательно) предоставить SQL-запросы, которые помогли этому анализу.

03 / что проверяют

Что проверяет это задание

01

Python

Обработка данных и расчёты: pandas, скрипты, автоматизация.

02

SQL

Выборки, агрегаты, джойны и оконные функции для анализа данных.

03

Аналитическое мышление

Как разложить задачу, выбрать подход и обосновать решение.

04 / как решать

Как подойти к решению

1
Разберите условие: что именно просят посчитать и в каких разрезах.
2
Сверьтесь с данными: какие таблицы есть, период и нужные фильтры.
3
Решайте по шагам и фиксируйте промежуточные результаты и допущения.
4
Доведите до финальных чисел и коротких выводов или рекомендаций.

05 / частые ошибки

Частые ошибки

Неверный период, разрез или единицы измерения.
Не учтены фильтры и сегменты из условия.
Решение без промежуточных шагов — только финальная цифра.
Нет выводов и рекомендаций по результату.

06 / хороший ответ

Каким должен быть сильный ответ

Хороший ответ — это не просто финальные числа или код. Работодатель должен увидеть, как вы думаете, как проверяете ограничения задачи и как оформляете результат.

короткое описание логики решения;
промежуточные таблицы, запросы и фильтры;
финальные значения по каждому пункту задания;
понятные выводы и рекомендации.

07 / похожие задания

Градус:
тестовое задание для инженера данных

Текст тестового задания

Задание #1

Задание #2

Задание #3

Что проверяет это задание

Python

SQL

Аналитическое мышление

Как подойти к решению

Частые ошибки

Каким должен быть сильный ответ

Похожие задания

Градус:тестовое задание для инженера данных

Текст тестового задания

Задание #1

Задание #2

Задание #3

Что проверяет это задание

Python

SQL

Аналитическое мышление

Как подойти к решению

Частые ошибки

Каким должен быть сильный ответ

Похожие задания

Хочешь больше таких разборов?

Разбираешь тестовые, но не уверен в решении?

Градус:
тестовое задание для инженера данных