Data Engineer

Оплата не указана

Вакансия находится в архиве

СБЕР

г. Москва

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Полный день

Формируется новая команда для исследований эффективности работы IT в группе компаний Сбер. Мы проводим сбор и анализ различных данных, описывающих поведение и результаты работ более 2000 команд. В том числе готовим данные и обучаем модели LLM. Основное направление работ – R&D, проверка гипотез и запуск новых инструментов и продуктов.

Наши задачи:

  • исследуем вопросы эффективности и ищем закономерности в поведении команд, проверяем гипотезы
  • формулируем и внедряем метрики оценки эффективности производства
  • готовим данные для всех этапов обучения моделей (в т.ч. LLM)
  • организуем всю разметку для своих моделей
  • инициируем различные эксперименты для обучения моделей
  • проектируем и реализуем новые B2E-продукты на базе ML/LLM под ключ, включая: Открытие новых продуктов, защита экономического обоснования; планирование, оценка сроков и рисков; полный цикл разработки от концепта до промышленной эксплуатации.

Обязанности

  • выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов
  • определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач
  • тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
  • оценка как полученное решение достигает поставленных целей
  • участие в разработке решения на основе обучения современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4)
  • построение пайплайна обработки данных и обучения LLM (LLM цепочек).
  • организация процесса мониторинга качества LLM
  • взаимодействие с другими участниками команды (DA / DE / BA / SA) для совместной работы (проверки гипотез, исследований, внедрения)
  • внедрение успешных гипотез/моделей в промышленную эксплуатацию
  • следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике.

Требования

  • опыт работы в области DS от 3-х лет
  • знания в области теории вероятностей, статистики, оптимизации, численных методов
  • хорошие навыки программирования, знание Python (на уровне middle-разработчика), SQL
  • свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений
  • знание методов классического NLP, сильные навыки Prompt Engineering
  • опыт работы с LLM-моделями (LangChain, LLama, ChatGPT, GigaChat)
  • уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании.

Условия

  • новая молодая команда, с которой можно расти вместе
  • масштабные, сложные и разнообразные задачи
  • есть возможность влиять на развитие продукта и результат
  • конкурентную компенсацию (оклад и премии по результатам деятельности)
  • свободный дресс-код
  • гибкий график для оптимального баланса работы и личной жизни
  • профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека
  • ДМС, страхование жизни
  • самые инновационные, амбициозные проекты и задачи.

Контактная информация

СБЕР

Сайт: sber.ru

Почта: не указана

Вакансия опубликована 18.04.2024 в г. Москва.

Похожие вакансии

#

Ростов-на-Дону

Удаленная работа

Подробное описание

9 августа

#

Не указана

Москва

Полный день

Подробное описание

2 апреля

#

Москва

Удаленная работа

Подробное описание

13 июля