Ищем data scientist в команду, комбинирующую применение бизнес-логики, классических моделей, NLP и LLM.
Основные задачи команды:
- Проведение исследований, проверка гипотез команды с использованием LLM.
- Совершенствование LLM моделей, используя промт-инжиниринг. Векторизация документов (для RAG сервиса).
- Преобразование изображения текста в машиночитаемый формат(OCR).
- Разработка и внедрение моделей(NLP\классический ML\графовые сети) в промышленные системы.
- Поиск и обработка данных, создание эмбеддингов, внедрение в текущие процессы.
Требования:
- Высшее математическое/техническое образование
- Понимание принципов работы с LLM
- Уверенное знание математики, статистики и машинного обучения;
- Владение Python и опыт практического применения алгоритмов машинного обучения: нейронные сети, композиционные алгоритмы, NLP.
- Уверенное владение SQL(оконные функции, регулярные выражения).
Будет плюсом:
- Опыт работы с Hadoop(HDFS, Hive/Impala), Spark.
- Опыт работы с нейронными сетями на последовательностях.