ML/DS специалист, направление NLP (Regular/Senior/Lead)

Оплата не указана

Вакансия находится в архиве

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Удаленная работа

Компетенции

Senior

Мы создаем высоконагруженные информационные системы и приложения для ОАО “РЖД”, которые делают работу миллионов людей продуктивнее, а жизнь — интереснее.
Наш подход — это человеко-ориентированный дизайн и создание сервисов такими, какими их хотят видеть сами пользователи.

Проект: Интеллектуальный помощник для Единой автоматизированной системы документооборота РЖД. В рамках проекта мы создаем голосового и текстового чат-бота. Основная функция чат-бота заключаться в предоставлении ответов на вопросы сотрудников по регламенту документооборота и работе в новом пользовательском интерфейсе системы документооборота. Интеллектуальным помощником ежедневно будут пользоваться 700 000 сотрудников компании ОАО “РЖД”.

Интеллектуальный помощник разрабатывает с применением комбинации подходов: сценарного чат-бота (фреймворк RASA) и генеративных моделей (LLM).

Задачи, над которыми предстоит работать:

  • разработка диалогового движка интеллектуального помощника;

  • дообучение моделей распознавания и генерации речи;

  • разработка и внедрение моделей NLP, в том числе на базе больших языковых моделей;

  • реализация логики пред/постобработки данных и результатов работы ML моделей;

  • реализация сервисов интеллектуального помощника и упаковка их Docker контейнеры;

  • участие в разработке архитектуры решения;

  • выбор технологии, языка программирования, библиотек и т.п.;

  • поддержка в актуальном состоянии документации по экспериментам и разработанному коду;

  • участие в ревью кода ML/DS разработчиков.

Стек и технологии Проекта: Python, RASA, PyTorch, Transformers, LLM, Vosk, Whisper, ONNX, Docker/Kubernetes, PostgreSQL, Weights & Biases (Wandb)

Мы ожидаем от кандидата:

  • опыт работы в области разработки и внедрения моделей машинного обучения в области NLP от 3-х лет;

  • знание основных алгоритмов машинного обучения, глубокого обучения, больших языковых моделей;

  • понимание цикла разработки решений с использованием моделей машинного обучения;

  • понимание основных метрик оценки качества ML моделей;

  • опыт работы с библиотеками: TensorFlow, Keras, PyTorch, RASA, transformers, torchaudio, spaCy, Scikit-learn, nltk, pandas;

  • понимание алгоритмов оптимизации и сжатия моделей;

  • опыт интеграции моделей в продуктивный код;

  • практические навыки работы с инструментами MLOps, CI/CD, Git, GitLab, Docker/Kubernetes;

  • английский язык на уровне чтения статей;

  • высшее образование в области компьютерной лингвистики, математики, физики, или смежной дисциплине.

Будет плюсом:

  • опыт сбора, разметки данных, знание основных инструментов и умение ими пользоваться;

  • опыт работы с моделями / продуктами на основе TTS/ASR (wosk-tts, whisper или иными).

Мы предлагаем:

  • работу в аккредитованной Минцифрой IT-компании, которая разрабатывает ПО, обеспечивающее непрерывность перевозочного процесса и эксплуатацию критической инфраструктуры РЖД;

  • трудоустройство по ТК РФ. Оклад, зависящий от уровня junior / regular / senior / lead;

  • график работы на выбор (удаленка / гибрид / офис);

  • ДМС со стоматологией после испытательного срока;

  • компенсация обедов с накопительной системой по электронным картам;

  • комфортный офис в центре Москвы (2 мин. от м. Красные ворота).

Ключевые навыки

Rasa
Python

Адрес

Москва, Центральный административный округ, Красносельский район, Каланчёвская улица, 13

Контактная информация

Цифровые Сервисы

Вакансия опубликована 31.07.2024 в г. Москва.