Чем предстоит заниматься: - Анализ требований, доработка и проектирование production pipeline;
- Анализ и подготовка данных для обучения алгоритмов ML, OCR, NLP;
- Обучение моделей ML, OCR, NLP;
- Дообучение и адаптация больших языковых моделей (LLM).
Наши пожелания к кандидату: - Глубокое понимание теории машинного обучения и принципов работы нейронных сетей;
- Знание классических и современных подходов к решению задач NLP и компьютерного зрения (OCR);
- Знания архитектур современных моделей для работы с текстами (Transformer-Based Models) и моделей для извлечения текста из изображений OCR;
- Опыт обучения и тонкой настройки современных моделей для работы с текстами (Sentence-Bert, Bert, NER, GPT, T5);
- Умение писать готовый к production код (Python), навыки написания SQL запросов.
Мы предлагаем:
- Официальное оформление в штат компании;
- Стабильный и прозрачный доход: оклад и премия по результатам работы;
- График работы: 5/2, удалённая работа;
- Личностное развитие и карьерный рост: корпоративная электронная библиотека, возможность прохождения бесплатного обучения и тренингов;
- Индивидуальную материальную помощь (компенсация процентов по ипотечному кредиту, дополнительные социальные льготы);
- Программу корпоративных скидок и привилегий: интернет, ТВ, сотовая связь, скидки от компаний-партнёров (отдых, покупки, обучение, спорт);
- Заботу о здоровье сотрудников: программа ДМС.
Стек технологий: Python, NLP, CV, Big Data, Pytorch, Sklearn, Pandas, Numpy, Machine Learning, Deep Learning, LLM, Gitlab