ML-разработчик в команду качества международного поиска организаций

Оплата не указана

Вакансия находится в архиве

Яндекс

г. Москва

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Полный день

Привет, на связи команда Яндекс Карт!

Мы используем машинное обучение, чтобы помочь пользователям международных продуктов Яндекса найти и выбрать организацию из определённой категории: скажем, ресторан или салон красоты.

Мы адаптируем технологии, которые успешно работают в Яндекс Картах, к новым языкам и культурам. Присоединившись к нам, вы сможете поучаствовать в создании новых экспериментальных продуктов на стадии «от 0 до 1» в разных странах.

В нашей команде проводят разработку full stack — от идеи, как решить задачу, до внедрения в продакшен. Мы разбираем проблемы в ответах моделей, проверяем работоспособность методов, изучая офлайн- и онлайн-метрики качества, имплементируем обученную модель для работы в рантайме или в регулярном пайплайне.

Наш стек: Python, С++, CatBoost, BERT, YaLM (Зелибоба), YandexGPT, YTsaurus, YQL.

Над какими задачами работаем:

Качество поиска
Как найти магазины, в которых можно купить редкую деталь для автомобиля? В каком салоне красоты по-особому красят волосы? Отвечать на подобные вопросы не так просто, а для ML-разработчика в нашей команде это отдельный вызов. Мы улучшаем качество ответов поиска по сложным запросам, опираясь на всю известную нам информацию об организации, включая отзывы, фотографии, сайты и информацию о меню и услугах.

Тематический блок Карт в веб-поиске
Иногда пользователь приходит в веб-поиск Яндекса с запросом о конкретной организации: например, он хочет туда добраться, позвонить или узнать часы работы. В таких случаях мы можем показать тематический блок с картой, телефоном и ссылками. Но он уместен далеко не всегда. Например, по запросу «Назарбаев» едва ли стоит показывать блок об университете имени Назарбаева. Нам предстоит улучшать качество тематического блока для пользователей Яндекса в разных странах.

Большие языковые модели для обучения других нейросетей
Мы используем множество асессорских разметок для обучения моделей. Один из способов повысить эффективность асессоров и полезность данных для обучения — отдавать на разметку людям только сложные случаи, а для простых решений применять тяжёлые LLM. Наша команда повышает эффективность сбора разметок и общее качество данных для обучения, применяя YandexGPT, чтобы в конечном счёте улучшить опыт пользователя, предложив более точное ранжирование в поиске, более подходящие подсказки и описания мест.

Мы ждём, что вы

  • Знаете математическую статистику, анализ данных и ML
  • Применяли методы ML для решения задач ранжирования, классификации или обработки текста
  • Знакомы с классическими алгоритмами и структурами данных
  • Пишете на Python

Будет плюсом, если вы

  • Умеете программировать на С++

P.S. Быстрей всегда состыковаться в Telegram, пишите с любыми вопросами по вакансии :) @martialoladushek

Ключевые навыки

Python
Machine learning
Apache opennlp
Алгоритмы и структуры данных

Контактная информация

Яндекс

Сайт: не указан

Почта: не указана

Вакансия опубликована 17.08.2024 в г. Москва.

Похожие вакансии

#

Москва

Полный день

Подробное описание

2 мая

#

Москва

Полный день

Подробное описание

23 апреля

#

Пермь

Полный день

Подробное описание

23 июля