Чем предстоит заниматься:
- Разработка и поддержка решений для управления основными данными (MDM).
- Интеграция данных из различных источников и обеспечение их консистентности и целостности.
- Разработка ETL процессов для обработки и нормализации данных.
- Создание и поддержка системы качества данных, управление их дублированием.
- Интеграция с Kafka для обеспечения надежной передачи и синхронизации данных.
- Разработка и поддержка процессов парсинга данных из интернета и их интеграции в MDM.
- Работа с метаданными, управление ими и их обновление.
- Тесное взаимодействие с командами DWH и BI для обеспечения корректного использования
- данных.
Наши ожидания от кандидата:
- Высшее математическое или техническое образование;
- Минимум 3 года опыта работы в управлении данными, инжиниринге данных или анализе данных
- в сфере веб и/или мобильных продуктов;
- Опыт работы с MDM решениями и понимание принципов управления основными данными.
- Опыт разработки ETL процессов и работы с инструментами ETL.
- Глубокие знания SQL и опыт работы с реляционными базами данных.
- Опыт работы с Apache Kafka для интеграции и синхронизации данных.
- Навыки парсинга данных из интернета и их нормализации.
- Опыт работы с инструментами управления качеством данных и их дублированием.
- Опыт работы с метаданными и их управлением.
Будет огромным плюсом:
- Опыт работы с Python и знание его экосистемы для работы с данными.
- Опыт работы в среде DevOps и облачных технологиях (AWS, GCP, Azure).
Условия:
- График 5/2 с 10.00 до 19.00
- Удаленный формат работы
- Возможность работать из любой точки мира