Какие задачи нужно будет решать:

Генерация и проверка гипотез, а также разработка продуктовых сервисов, связанных с OCR и QA;
Разработка и тюнинг моделей машинного обучения;
Поддержка и документация разработанных решений;
Написание тестов.

Требования к вакансии:

Отличные знания Python;
Опыт с работы с DL-фреймворками (предпочтительно Pytorch, но возможно Keras, Tensorflow, etc.)
Математическая подготовка: понимание принципов работы машинного обучения, в частности, работы нейросетей;
Знание методов, алгоритмов и инструментов классического ML: Numpy, Pandas, Sklearn, методы снижения размерности, методы кластеризации, бустинги и т.д.
Опыт разработки решений на базе технологий компьютерного зрения;
Опыт работы с transfer learning и OpenCV;
Понимание принципов работы моделей классификации изображений, семантической сегментации и детекции объектов на изображении;
Хорошие навыки работы в Linux;
Опыт работы с микросервисами Docker.

Будет плюсом:

Опыт работы с системами логирования, например стек ELK;
Опыт работы с backend - Fast API и тд;
Опыт разработки OCR-систем, понимание что такое CTC-loss и принципов работы современных OCR-систем;
Опыт работы с экстрактивным QA и VQA;
Опыт работы MLOps инструментами - MLFlow, ClearML, WandB, стэк Iterative (dvc, mlem, cml) или другими.

Middle Data Scientist (OCR)