На данный момент мы ищем Системного аналитика хранилищ данных в "ДатаЛаб".
Направление «ДатаЛаб» специализируется на Big Data, машинном и глубоком обучении и искусственном интеллекте с 2021 года. В составе направления более 60 специалистов. Гордимся тем, что создали для «ВкусВилл» предиктивную модель по прогнозированию сроков доставки, а также систему, которая рекомендует покупателям товары в мобильном приложении, что улучшает лояльность клиентов.
Чем предстоит заниматься:
- общаться с бизнес-заказчиками, структурировать и согласовывать требования, координировать всех участников процесса;
- проводить анализ и декомпозицию по задаче, вести документацию и создавать ТЗ для разработчиков (а часть задач по разработке вообще выполнять самостоятельно, хороший системный аналитик это уже почти дата инженер);
- исследовать источники данных (MsSQL, Postgress, Greenplum, Clickhouse и т.д.), их атрибутный состав, объем и как они обновляются;
- проектировать витрины данных (SQL) и искать пути оптимизации их сборки;
- проектировать потоки данных (Airflow) и модели данных (ER modeling, Data Vault, Dimensional modeling);
- проводить тестирование, уточнять бизнес логику, делать сверки данных, анализировать причины расхождений.
Что мы ожидаем от кандидата:
- опыт работы системным/бизнес аналитиком, дата инженером;
- умение декомпозировать требования, вести документацию;
- отличное знание SQL (как родной язык);
- опыт работы с различными базами данных (Postgress, Greenplum, Clickhouse, Vertica, Teradata и т.д);
- у тебя есть опыт проектирования витрин данных, потоков данных, а так же опыт моделирования баз данных;
- умеешь копаться и понимать чужой код, можешь предложить варианты сделать быстрее/лучше/короче;
- знание основных практик DWH, понимание, чем различные инструменты отличаются друг от друга и для чего их лучше применять (или не применять).
Будет плюсом:
- Python;
- продвинутые знания по базам данных (MPP, SCD, партицировние, анализ и оптимизация запросов и т.д.);
- Airflow, Spark, Nifi и т.д.