Оплата не указана
Вакансия находится в архиве
Требуемый опыт работы
От 3 до 6 лет
Тип занятости
Полная занятость
График работы
Полный день
Цифровые поверхности Салют (SberDevices) — уникальное IT-пространство внутри Сбера. Мы занимаемся разработкой голосовых продуктов, умных устройств и виртуальных ассистентов и сервисов для них.
Наша команда готовит данные для базовых моделей LLM (GigaChat) и Speech (ASR, Spotter, виртуальные ассистенты). Кроме того, мы помогаем смежным командам эффективно использовать данные технологии для оптимизации бизнес-процессов, улучшения сервисов.
Наши направления на проекте:
Gigachat Data готовит данные для всех этапов обучения GigaChat: файнтюнинг (SFT), RLHF, доменное обучение (например, математика, финансы, медицина), продуктовые кейсы. Кроме текстовых моделей мы формируем обучающие и тестовые сеты мультимодальных моделей и эмбедеров.
Speech Data готовит данные для всех голосовых задач в SaluteSpeech. Вместе с ML-инженерами мы разрабатываем модели распознавания речи, диаризации, споттера, распознавания эмоций, а еще учим GigaChat понимать звук. У нас современный стек, мощные сервера и петабайты аудио.
Задачи, с которыми работаем:
Мы ожидаем, что вы:
Будет плюсом:
Почему вам понравится работать с нами:
Ключевые навыки
Адрес
Москва, Кутузовский проспект, 32к1
Контактная информация
СБЕР
Сайт: sber.ru
Почта: не указана
Вакансия опубликована 01.08.2024 в г. Москва.
Похожие вакансии
Не указана
Москва
Полный день
Подробное описание
16 августа