Какие задачи нужно будет решать:
- Генерация и проверка гипотез, а также разработка продуктовых сервисов, связанных с OCR и QA;
- Разработка и тюнинг моделей машинного обучения;
- Поддержка и документация разработанных решений;
- Написание тестов.
Требования к вакансии:
- Отличные знания Python;
- Опыт с работы с DL-фреймворками (предпочтительно Pytorch, но возможно Keras, Tensorflow, etc.)
- Математическая подготовка: понимание принципов работы машинного обучения, в частности, работы нейросетей;
- Знание методов, алгоритмов и инструментов классического ML: Numpy, Pandas, Sklearn, методы снижения размерности, методы кластеризации, бустинги и т.д.
- Опыт разработки решений на базе технологий компьютерного зрения;
- Опыт работы с transfer learning и OpenCV;
- Понимание принципов работы моделей классификации изображений, семантической сегментации и детекции объектов на изображении;
- Хорошие навыки работы в Linux;
- Опыт работы с микросервисами Docker.
Будет плюсом:
- Опыт работы с системами логирования, например стек ELK;
- Опыт работы с backend - Fast API и тд;
- Опыт разработки OCR-систем, понимание что такое CTC-loss и принципов работы современных OCR-систем;
- Опыт работы с экстрактивным QA и VQA;
- Опыт работы MLOps инструментами - MLFlow, ClearML, WandB, стэк Iterative (dvc, mlem, cml) или другими.