Data Scientist / ML engineer

Оплата не указана

Вакансия находится в архиве

Эмбедика

г. Москва

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Полный день

Embedika — научно-ориентированная ИТ-компания, разработчик систем поиска и анализа документов на основе data science технологий.

Разрабатываем интеллектуальные продукты для Legaltech (не только, но фокус в эту сторону), причем очень успешно. Проводим ресёрч и конференции вместе с Центром больших данных в МИСиС и запустили совместно с ними DS-магистратуру - там даже можно почитать гостевые лекции, если захочется.

На данный момент у нас планируется рост по проектам и продуктам, сейчас мы усиливаем направление R&D и ищем в команду ML-engineer.

Что предстоит делать:

  • Разрабатывать NLP-модели (Классификация, NER, тематическое моделирование)

  • Писать микросервисы для упаковки ML-моделей (активно работаем с Docker)

  • Разрабатывать рекомендательные системы на крупном проекте

  • Разрабатывать системы дообучения и автообучения ML-моделей на обновляющихся в процессе опытной эксплуатации данных (автоматическая замена весов моделей в Проде по запросу пользователя)

  • Взаимодействовать с командами Тестирования/DevOPS/Стейкхолдерами от бизнеса (по запросу объяснить сложное простыми словами)

  • Участвовать во внутренних конференциях, обмен знаниями с участниками ресёрч команды

Наши технологии: Python, PyTorch, Transformers, Onnx, Flask, Docker, Gitlab-CI, Nexus, DVC, S3, Kubernetes, Supervisord

Чего мы ждем от кандидата:

  • Опыт работы в области NLP от 1 года

  • Опыт обучения и файнтюна моделей на задачи NLP и работы с эмбеддингами (Word2Vec, fastText, BERT)

  • Хороший математический бэкграунд: понимание основных методов статистики, алгоритмов машинного обучения, структур данных

  • Уверенное программирование на Python

  • Знание основных библиотек для анализа данных, включая NumPy, Pandas, Matplotlib, sklearn + XGBoost / LightGBM / CatBoost, Transformers

  • DeepLearning: PyTorch, ONNX

  • Умение писать оптимальный по памяти и времени код

  • Базовые знания Linux

  • Опыт или желание освоить работу с Docker, DVC

  • Образование в сфере компьютерных/технических наук – МГУ, МФТИ, ВШЭ, кафедры и специальности по направлению «машинное обучение» или смежные (не ниже бакалавра)

  • Знание Git, Docker

  • Опыт работы с Jira, Confluence (опционально)

  • Английский не ниже Intermediate (нужно уметь читать научные статьи)

Возможности:

  • Разработка ML-моделей “под ключ”, весь пайплайн от предобработки данных и обучения моделей до сборки сервиса тестирования и внедрения в прод

  • Команда разработчиков, рядом с которыми интересно расти и работать

  • Работа с большим количеством сервисов разных тематик

  • Работа с семантическим моделированием

  • Сейчас стартовали разработку сервисов на базе генеративных сетей - отличная возможность “быть в тренде”

  • В планах решение задач суммаризации

Мы предлагаем:

  • ​​Работу с крупными заказчиками. Разрабатываем крупные интеллектуальные системы для автоматизации бизнес-процессов наших заказчиков

  • Персональное предложение по зарплате в зависимости от уровня опыта и навыков

  • Мы аккредитованная it компания

  • Широкая зона ответственности, отсутствие границ в профессиональном и карьерном развитии

  • Нет бюрократии, прозрачное и понятное решение вопросов

  • Компетентное руководство, которое находится на передовой современных технологий

  • Комфортный график работы, возможность полной удаленной работы

  • Компенсируем обучение и конференции

  • ДМС со стоматологией и страховкой ВЗР

  • Доверие в команде и качественная обратная связь

  • Комфортный офис в центре с безлимитным кофе, фруктами, йогуртами на ваш вкус

  • Прокачка личного бренда (публикуем статьи, отправляем на конференции, чтение курсов для магистров по желанию)

Ключевые навыки

Python
Apache opennlp
Machine learning
Linux
Docker
Data science
Deep learning
Mlflow
Извлечение сущностей
Поисковые алгоритмы
Version control/git

Контактная информация

Эмбедика

Сайт: embedika.ru

Почта: info@embedika.ru

Вакансия опубликована 03.02.2024 в г. Москва.

Похожие вакансии

#

Москва

Полный день

Job location: Saint-Petersburg.

Responsibilities:

  • Assist the Engineering Manager in planning and executing the engineering scope of work for projects
  • Coordinate with various engineering teams to ensure effective communication and alignment of project objectives...

27 марта

#

Не указана

Москва

Полный день

Наш партнер - крупная FMCG компания открывает конкурс на позицию "DATA инженер"

Предстоящие задачи:

  • Взаимодействие с техническими специалистами команд поддержки инфраструктуры и приложений в целях ручной и автоматизированной выгрузки данных...

2 июля

#

от 250 000 до 300 000 ₽

Москва

Удаленная работа

Мы Glory Group — группа компаний, которая включает в себя разные масштабные проекты: многопрофильное рекламное агентство в сфере Digital, продукты для iGaming-индустрии, бинарные опционы и революционное направление Search Feed через TikTok...

23 апреля