Формируется новая команда для исследований эффективности работы IT в группе компаний Сбер. Мы проводим сбор и анализ различных данных, описывающих поведение и результаты работ более 2000 команд. В том числе готовим данные и обучаем модели LLM. Основное направление работ – R&D, проверка гипотез и запуск новых инструментов и продуктов.
Наши задачи:
- исследуем вопросы эффективности и ищем закономерности в поведении команд, проверяем гипотезы
- формулируем и внедряем метрики оценки эффективности производства
- готовим данные для всех этапов обучения моделей (в т.ч. LLM)
- организуем всю разметку для своих моделей
- инициируем различные эксперименты для обучения моделей
- проектируем и реализуем новые B2E-продукты на базе ML/LLM под ключ, включая: Открытие новых продуктов, защита экономического обоснования; планирование, оценка сроков и рисков; полный цикл разработки от концепта до промышленной эксплуатации.
Обязанности
- выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов
- определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач
- тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
- оценка как полученное решение достигает поставленных целей
- участие в разработке решения на основе обучения современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4)
- построение пайплайна обработки данных и обучения LLM (LLM цепочек).
- организация процесса мониторинга качества LLM
- взаимодействие с другими участниками команды (DA / DE / BA / SA) для совместной работы (проверки гипотез, исследований, внедрения)
- внедрение успешных гипотез/моделей в промышленную эксплуатацию
- следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике.
Требования
- опыт работы в области DS от 3-х лет
- знания в области теории вероятностей, статистики, оптимизации, численных методов
- хорошие навыки программирования, знание Python (на уровне middle-разработчика), SQL
- свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений
- знание методов классического NLP, сильные навыки Prompt Engineering
- опыт работы с LLM-моделями (LangChain, LLama, ChatGPT, GigaChat)
- уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании.
Условия
- новая молодая команда, с которой можно расти вместе
- масштабные, сложные и разнообразные задачи
- есть возможность влиять на развитие продукта и результат
- конкурентную компенсацию (оклад и премии по результатам деятельности)
- свободный дресс-код
- гибкий график для оптимального баланса работы и личной жизни
- профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека
- ДМС, страхование жизни
- самые инновационные, амбициозные проекты и задачи.