Middle-Senior Machine Learning Engineer (NLP, Search Engine)

Оплата не указана

Оператор Газпром ИД

Сокол

г. Санкт-Петербург

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Удаленная работа

Компетенции

Senior

Команда ГИД ДАТА создает ML-решения, широко востребованные на российском рынке. Мы успешно совершенствуем SaaS для поиска и рекомендаций для лидерских проектов рунета.

Спроси себя, хочешь ли ты:

- обрабатывать миллионы видео со стриминговых сервисов;

- предоставлять пользователям релевантный контент;

- искать структуры в неструктурированных данных;

- бороться за каждую миллисекунду скорости;

- делать продукт, который сделает лучше пользовательский опыт?

Наша команда растет и мы ищем Middle-Senior ML/NLP Engineer (Search Engine).

Наш стек:

- Language: Python;

- ML: pytorch, CatBoost, Nltk, PyMorphy и многое другое =) ;

- DB: PostgreSQL, QDrant, ClickHouse, Redis, OpenSearch;

- Data Processing: Spark;

- Queue: Kafka;

- Orchestration: K8s;

- DevOps: Docker, Helm;

- Services: Dagster, ClearML, MLFlow, GitLab;

- Log: ELK (под OpenSearch стек);

- Monitoring: Grafana, Prometheus.

С чем можно будет поработать:

- Работа с большими данными и высокой нагрузкой;

- С Machine Learning сервисами, которые приносят людям пользу =) ;

- Общение с экспертами в области разработки и ML из разных областей.

Чем предстоит заниматься:

- Разрабатывать в рамках развития единой поисковой платформы Navigator модели для поиска, ранжирования, рекомендаций в топовых видеосервисах;

- Дизайнить и проводить A/B-эксперименты;

- Внедрять в существующие сервисы новые модели и алгоритмы;

- Исследовать данные контента, строить и внедрять вместо с дата-инженерами pipeline-ы для их обработки;

- Улучшать качество и скорость работы существующих алгоритмов.

Что мы ожидаем:

- Знание и применение базовых и ML алгоритмов;

- Опыт построение NLP-сервисов от постановки бизнес задачи до внедрения сервиса в production;

- Опыт разработки и внедрения моделей для NLP-задач, поиска, ранжирования, рекомендаций в production-сервисы;

- Знание и применение Python в production от 3х лет;

- Умение определить, где нужен DL, а где достаточно регулярки =) ;

- Навыки работы с SQL и NoSQL базами данных.

Будет замечательно, если есть:

- Опыт работы с перечисленным выше стеком;

- Победы в соревнованиях на kaggle, ML-хакатонах и т. п.;

- Успешные внедрения высоконагруженных сервисов;

- Публикации в области NLP, поиска, ранжирования, рекомендаций;

- Опыт участия в развитии open-source библиотек.

Мы предлагаем:

- Мы - аккредитованная в Минцифры IT-компания;

- Оформление по ТК РФ, конкурентная заработная плата;

- Гибридный график работы 5/2, гибкое начало дня (возможна удаленка с территории РФ);

- ДМС со стоматологией и госпитализацией в классных клиниках;

- Профессиональное обучение и конференции;

- Комфортный офис A-класса около м. Сокол;

- Современное топовое оборудование, мощные ноутбуки;

- Комфортная кухня с вкусным кофе, чаем, какао, орешками, фруктами, снэками и прочими ништяками.

Минусы:

- Очень много интересных и сложных задач;

- Будут спрашивать результаты работы.

Контактная информация

Оператор Газпром ИД

Сайт: не указан

Почта: не указана

Вакансия опубликована 07.06.2024 в г. Санкт-Петербург.

Похожие вакансии

#

Калуга

Полный день

НАЙМ НА СРОЧНЫЙ ТРУДОВОЙ ДОГОВОР

Eager to experience leading a business even before you graduate? Take your internship with the #1 Company for Leaders at one of the biggest P&G plants in the world – P&G Novomoskovsk...

30 июня

#

Не указана

Москва

Полный день

Проект:

Мы - передовая высокотехнологичная команда создающая AI продукты для разработчика. Мы сделали GigaCode - AI-ассистент, ускоряющий написание программного кода. Поскольку мы продолжаем расти и все больше инженеров пользуются нашими инструментами, мы ищем...

13 июня

#

Не указана

Ижевск

Полный день

Современная и высокотехнологичная компания, представляющая инновационную платформу для научных исследований, совмещающая разработку ПО и виртуальных тренажеров, создание новых средств связи и исследования в области искусственного интеллекта, нейронных...

26 апреля