Формируется новая команда для исследований эффективности работы IT в группе компаний Сбер. Мы проводим сбор и анализ различных данных, описывающих поведение и результаты работ более 2000 команд. В том числе готовим данные и обучаем модели LLM. Основное направление работ – R&D, проверка гипотез и запуск новых инструментов и продуктов.

Наши задачи:

исследуем вопросы эффективности и ищем закономерности в поведении команд, проверяем гипотезы
формулируем и внедряем метрики оценки эффективности производства
готовим данные для всех этапов обучения моделей (в т.ч. LLM)
организуем всю разметку для своих моделей
инициируем различные эксперименты для обучения моделей
проектируем и реализуем новые B2E-продукты на базе ML/LLM под ключ, включая: Открытие новых продуктов, защита экономического обоснования; планирование, оценка сроков и рисков; полный цикл разработки от концепта до промышленной эксплуатации.

Обязанности

выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов
определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач
тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
оценка как полученное решение достигает поставленных целей
участие в разработке решения на основе обучения современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4)
построение пайплайна обработки данных и обучения LLM (LLM цепочек).
организация процесса мониторинга качества LLM
взаимодействие с другими участниками команды (DA / DE / BA / SA) для совместной работы (проверки гипотез, исследований, внедрения)
внедрение успешных гипотез/моделей в промышленную эксплуатацию
следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике.

Требования

опыт работы в области DS от 3-х лет
знания в области теории вероятностей, статистики, оптимизации, численных методов
хорошие навыки программирования, знание Python (на уровне middle-разработчика), SQL
свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений
знание методов классического NLP, сильные навыки Prompt Engineering
опыт работы с LLM-моделями (LangChain, LLama, ChatGPT, GigaChat)
уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании.

Условия

новая молодая команда, с которой можно расти вместе
масштабные, сложные и разнообразные задачи
есть возможность влиять на развитие продукта и результат
конкурентную компенсацию (оклад и премии по результатам деятельности)
свободный дресс-код
гибкий график для оптимального баланса работы и личной жизни
профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека
ДМС, страхование жизни
самые инновационные, амбициозные проекты и задачи.

Data Engineer

Обязанности

Требования

Условия