Чем нужно будет заниматься: - Разработка регулярно обновляемых отчётов на основе бизнес-требований
- Построение последовательных преобразований (пайплайнов) для подготовки витрин данных в airflow
- Написание алгоритмов для предварительной очистки данных, проверка качества данных
- Поддержка и обновление текущих пайплайнов
- Введение документации по витринам данных
- Code-review аналитического ETL
Откликайся на вакансию, если у тебя есть:
- Опыт работы в области анализа данных — от трех лет, большим плюсом будет наличие релевантного опыта работы с мобильными приложениями
- Умение анализировать и понимать бизнес-требования
- Опыт обработки данных в Python: pandas, numpy, requests
- Опыт написания сложных SQL запросов
- Опыт работы с Airflow (написание дагов или их настройка)
- Опыт разработки витрин данных (желательно понимание принципов архитектуры данных)
Наш стек: hadoop + presto, python, airflow, git