Middle Data Scientist (NLP)

Оплата не указана

Вакансия находится в архиве

Гринатом

г. Москва

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Полный день

Какие задачи нужно будет решать:

  • Генерация и проверка гипотез, а также разработка продуктовых сервисов, связанных с поиском, рекомендательными системами, классификацией текстов и иными видами обработки естественного языка;
  • Разработка и тюнинг моделей машинного обучение;
  • Поддержка и документация разработанных решений;
  • Написание тестов.

Требования к вакансии:

  • Отличные знания Python;
  • Опыт с работы с DL-фреймворками (предпочтительно Pytorch, но возможно Keras, Tensorflow, etc.)
  • Математическая подготовка: понимание принципов работы машинного обучения, в частности, работы нейросетей;
  • Знание методов, алгоритмов и инструментов классического ML: Numpy, Pandas, Sklearn, методы снижения размерности, методы кластеризации, бустинги и т.д.
  • Глубокое понимание алгоритмов нормализации текстов, различных методов создания эмбеддингов, а также умение их использовать на практике;
  • Опыт работы с трансформерами и transfer learning;
  • Понимание как декомпозировать различные бизнес-кейсы на типовые задачи NLP;
  • Хорошие навыки работы в Linux;
  • Опыт работы с микросервисами Docker;

Будет плюсом:

  • Опыт работы с системами логирования, например стек ELK;
  • Опыт работы с backend - Fast API и тд;
  • Опыт работы с поисковыми движками - Faiss, ElasticSearch/OpenSearch, Milvus, Qdrant, PGVector и т.д.
  • Опыт работы MLOps инструментами - MLFlow, ClearML, WandB, стэк Iterative (dvc, mlem, cml) или другими;
  • Опыт работы/pet-проектов с LLM;

Ключевые навыки

Libtorch (pytorch c++ api)
Python
Python (pandas, numpy, matplotlib)

Контактная информация

Гринатом

Сайт: greenatom.ru

Почта: не указана

Вакансия опубликована 09.08.2024 в г. Москва.

Похожие вакансии

#

Самара

Полный день

Подробное описание

30 июля

#

Москва

Удаленная работа

Подробное описание

10 февраля

#

Москва

Площадь Ильича

и еще 1 станция

Полный день

Подробное описание

29 мая