Middle Data Engineer (EDP)

Оплата не указана

Вакансия находится в архиве

Группа компаний С7

Кузнецкий мост

и еще 2 станции

г. Москва

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Полный день

S7 TechLab – IT компания, реализующая инновационные IT продукты для подразделений группы компаний S7. NLP чат-боты для поддержки пользователей, компьютерное зрение для бортов самолетов, прогнозирование загрузки самолета – это лишь некоторые примеры типовых задач, которые реализуются силами команды S7 TechLab и помогают авиакомпании занимать лидирующее место на рынке авиаперевозок России.

Мы приглашаем в нашу команду Data engineer уровня middle на продукты Data Platform и Domain Datawarehouses.

Проект платформы данных представляет собой аналитическую платформу уровня предприятия, основанную на решениях с открытым исходным кодом и ориентированную на самообслуживание. Платформа состоит из различных компонентов, включая Airflow, Spark, Kafka, Prometeus, Grafana, Great Expectation, Datahub, Trino и другие. Задачи включают разработку и поддержку этих компонентов, их интеграцию с другими сервисами и создание дополнительных сервисов self-service для обработки данных.

Проект DDW (Domain Data WareHouse), объединяет под собой 3 хранилища:

  • ADW – данные по самолетам и их обслуживанию
  • FDW – данные по расписанию
  • SDW – данные по сотрудникам всей АК

Основная задача проекта – стать единым исчерпывающим источником подготовленных доменных данных дляпотребителей. Данные должны быть качественными и отдаваться с учетом SLA.

Задачи:

  • Разработка и поддержка ETL/ELT процессов для интеграции, очистки и преобразования данных и работа с API.
  • Создание и поддержка хранилищ данных, витрин данных и моделей данных.
  • Развертывание и настройка инструментов и фреймворков для обработки и анализа данных.
  • Работа с различными источниками данных, включая структурированные, полуструктурированные и неструктурированные данные.
  • Взаимодействие с командой разработки, специалистами по обработке данных, инженерами облачной инфраструктуры, специалистами ИБ.
  • Участие в разработке и поддержке скриптов автоматизации для CI/CD и управлении конфигурациями и инфраструктурой.
  • Мониторинг и оптимизация производительности ETL/ELT процессов.
  • Документирование процессов и процедур работы с данными.

Пожелания к кандидату:

  • Знание основных принципов и инструментов ETL/ELT.
  • Опыт работы с SQL и NoSQL базами данных.
  • Практические навыки работы с инструментами обработки и анализа данных, такими как Apache Spark, Apache Kafka, Hadoop, Hive, Trino, Airflow, DBT, Great Expectations etc.
  • Хорошее представление о принципах и инструментах BigData.
  • Уверенное владение одним из языков программирования Python, Scala, Java
  • Навыки работы с системами контроля версий Git/SVN
  • Опыт работы с облачными платформами AWS/Azure/GCP, либо аналогичными open source решениями.
  • Понимание принципов контейнеризации Docker и оркестрации Kubernetes.
  • Умение работать в команде, хорошие коммуникативные навыки.
  • Желание развиваться и изучать новые технологии и концепции в области обработки данных и управления данными, в частности Data Mesh.

Что мы предлагаем:

  • ДМС со стоматологией;
  • Корпоративную жизнь, насыщенную разнообразными коллективными событиями;
  • Подарки для детей к первому классу и на Новый год;
  • Профессиональное развитие: проходить обучение в компаниях-партнерах, участие и выступление в конференциях;
  • Самостоятельность и широкий диапазон влияния на продукт. Возможность существенно улучшать и изменять, предлагать идеи — всё это можно и нужно.
  • Возможность путешествовать по специальным корпоративным тарифам для вас и вашей семьи;
  • Корпоративные скидки в PrimeZone: скидки в рестораны, на обучающие курсы, товары и тд.;
  • Команда распределенная, удаленка РФ либо у нас есть 3 уютных офиса: г. Москва Петровка 7, г. Краснодар или г. Иннополис :)
  • ИТ аккредитованная компания;
  • Полное соблюдение Законодательства Российской Федерации.

Ключевые навыки

Python
Sqlite
Apache kafka
Spark framework
Airflow

Адрес

Москва, улица Петровка, 7

Контактная информация

Группа компаний С7

Сайт: s7.ru

Почта: не указана

Вакансия опубликована 22.08.2024 в г. Москва.

Похожие вакансии

#

Москва

Удаленная работа

Подробное описание

18 ноября

#

Москва

Полный день

Подробное описание

3 июня

#

Senior

Москва

Удаленная работа

Подробное описание

22 октября