Senior ETL-разработчик/ ETL-developer (Greenplum) в Fintech

от 350 000 до 500 000 ₽ на руки

Вакансия находится в архиве

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Удаленная работа

IT-холдинг, работающий по всему миру. В нашем портфолио несколько ключевых направлений:

-Внедряем BI и аналитику;

-Внедряем корпоративные платформы данных;

На текущий момент нам требуется ETL-разработчик уровня middle+/senior на новый Fintech проект (no banking) по миграции КХД с MsSQL на Greenplum

Вам предстоит:

  • Совместная работа с DBA-архитектором на проектах;
  • Организация ETL-процессов выгрузки данных Apache Hudi таблиц из S3 в ODS-слой на Greenplum;
  • Разработка трансформации данных ODS-слоя в DDS-слой;
  • Имплементация различных CDC-методов (инкрементальный JOIN с двумя наборами данных, вычисление хэша с последующим diff);
  • Разработка plpgsql-функций или аналогичной логики на Spark для трансформации данных, на основе логике существующего Python/T-SQL кода (MSSQL);
  • Разработка ad-hoc аналитических запросов под PostgreSQL/Greenplum;
  • Разработка DataQuality-тестов на скриптовом ETL (Pyhon, Java или Scala);
  • Работа с AirFlow-операторами, разработка DAGs;

Наш идеальный кандидат:

  • Имеет опыт ETL-разработчика от 4 лет;
  • Имеет опыт с технологическим стеком: Greenplum, PXF, Spark.
  • Понимает различия PostgreSQL & Greenplum;
  • Понимает механизма работы QE/QD (query executor & query dispatcher), и как исполняется SQL-запрос в Greenplum-кластере, включая планы запросов (redistribute, broadcast, gather motions);
  • Понимает механизм дистрибьюции данных на сегмент-инстансах Greenplum, и как исправлять перекосы данных (skews);
  • Понимает разницу механизмов работы Heap & AOP (append-optimzed) таблиц в Greenplum, включая понимание “ограничений” колоночного формата хранения данных;
  • Понимает различия между логическими моделями: звезды, снежинки и DataVault;
Мы предлагаем:
  • Удалённая работа из РФ;
  • Работу без бюрократии и ненужных ритуалов. Мы работаем вместе, чтобы помочь вам реализовать ваши амбиции, а компании — расти;
  • ДМС: нам важно, чтобы наши сотрудники развивали свои компетенции и были здоровы;
  • Невероятную корпоративную жизнь: от походов в музеи до совместных путешествий и rave-вечеринок;
  • Гибкое время начала рабочего дня.

Ключевые навыки

Sqlite
Dwh
Cpp-netlib
Greenplum
Python
Java
Scala
Pxf
Spark framework
Postgresql
Gpfdist
Apache airflow
Apache spark

Контактная информация

Лао Оливарес Кристина Вячеславовна

Сайт: t.me

Почта: не указана

Вакансия опубликована 24.10.2024 в г. Москва.

Похожие вакансии

#

Москва

Удаленная работа

Подробное описание

8 июля

#

Москва

Гибкий график

Подробное описание

7 августа

#

Москва

Полный день

Подробное описание

16 апреля