В команду Knowledge Management, разрабатывающую retrieval augmented расширения для LLM GigaChat требуется Data/Prompt Engineer. Наша команда работает над расширением возможностей GigaChat в работе со специализированной инженерной и IT-тематикой.
Обязанности
- Подготовка данных для LLM-модели
- Разработка метрик качества и тестирование LLM-модели
- Дообучение языковой модели
- Разработка навыков и оптимизация запросов (prompt-engineering)
- Подготовка валидационных датасетов
Требования
- Опыт работы с большими языковыми моделями
- Понимание принципов и основ обучения языковых моделей
- Понимание основ работы индексации и поисковых решений
- Понимание алгоритмов улучшения качества поисковой выдачи
- Навыки программирования на Python
Будет плюсом:
- Контейнеризация: Docker
- Виртуализация: OpenShift
- Брокеры сообщений: Kafka
- Инструменты DevOps: Git, Bitbucket, Nexus, Jenkins
- Опыт работы с ранжированием, рекомендациями, NLP-механиками
- Опыт работы с SFT-обучением моделей, подготовка разметки
- Знание Elastic Search
- Знание C#
Условия
- Офис БЦ «Даниловский форт» (м.Нагатинская, м.Тульская);
- График с гибким началом рабочего дня;
- График 5/2, возможен гибридный формат работы;
- Отсутствие строго дресс-кода;
- Стабильный оклад и социальную поддержку сотрудников;
- ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких;
- Корпоративная пенсионная программа;
- Корпоративное обучение за счет компании;
- Реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей;
- Официальное оформление с первого дня;
- Корпоративный спортзал;
- Скидки на продукты Сбера и компаний экосистемы.