Какие задачи нужно будет решать:
- Генерация и проверка гипотез, а также разработка продуктовых сервисов, связанных с поиском, рекомендательными системами, классификацией текстов и иными видами обработки естественного языка;
- Разработка и тюнинг моделей машинного обучение;
- Поддержка и документация разработанных решений;
- Написание тестов.
Требования к вакансии:
- Отличные знания Python;
- Опыт с работы с DL-фреймворками (предпочтительно Pytorch, но возможно Keras, Tensorflow, etc.)
- Математическая подготовка: понимание принципов работы машинного обучения, в частности, работы нейросетей;
- Знание методов, алгоритмов и инструментов классического ML: Numpy, Pandas, Sklearn, методы снижения размерности, методы кластеризации, бустинги и т.д.
- Глубокое понимание алгоритмов нормализации текстов, различных методов создания эмбеддингов, а также умение их использовать на практике;
- Опыт работы с трансформерами и transfer learning;
- Понимание как декомпозировать различные бизнес-кейсы на типовые задачи NLP;
- Хорошие навыки работы в Linux;
- Опыт работы с микросервисами Docker;
Будет плюсом:
- Опыт работы с системами логирования, например стек ELK;
- Опыт работы с backend - Fast API и тд;
- Опыт работы с поисковыми движками - Faiss, ElasticSearch/OpenSearch, Milvus, Qdrant, PGVector и т.д.
- Опыт работы MLOps инструментами - MLFlow, ClearML, WandB, стэк Iterative (dvc, mlem, cml) или другими;
- Опыт работы/pet-проектов с LLM;