ML-инженер в группу Information Retrieval Маркета

Оплата не указана

Вакансия находится в архиве

Яндекс

г. Москва

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Полный день

Каждый месяц миллионы человек выбирают товары в тысячах магазинов на Маркете. Наш сервис располагает огромной базой данных о предложениях магазинов, актульной информацией о ценах и наличии товаров, сроках и стоимости доставки. Маркет помогает пользователям выбирать лучшие товары, а продавцам — продвигать свой ассортимент.

Большим преимуществом Маркета на рынке E-commerce являются автоматические инструменты для систематизации предложений на площадке маркетплейса. Это позволяет продавцам выгружать данные о своих товарах на сервис в виде неструктурированных текстов, а дальше происходит магия Маркета, и товары отображаются на сервисе в удобном для пользователя виде.

Наши алгоритмы работают в трёх больших направлениях:

  • для пользователей — обеспечение удобного поиска товаров по структурированному каталогу с возможностью фильтровать товары по параметрам, обеспечение конкуренции цен предложений продавцов на карточках товаров;
  • для аналитиков рынка — сопоставление внешних данных с каталогом товаров Маркета для построения отчётов об объёмах продаж в различных сегментах рынка и оптимизации процессов ценообразования собственного ассортимента;
  • для внутренних процессов Маркета — оптимизация и ускорение процессов модерации контента за счёт предоставления саджестов и рекомендаций, снижение порога входа на Маркет для продавцов.

Какие задачи вас ждут

Собирать различные выборки и обучать на них модели машинного обучения (в том числе BERT, DSSM, CatBoost, YandexGPT)
Мы в команде решаем задачи, связанные с матчингом товаров между собой, классификацией товаров по товарному дереву и автоматизацией ручных процессов и разметок. Мы постоянно разрабатываем новые инструменты, адаптируем существующие под конкретные бизнес-задачи, а также внедряем крупные ML-технологии, появляющиеся в Яндексе.

Взаимодействовать с системами краудсорсинга по разметке данных для обучения
У нас нет пользовательских логов в привычном понимании, поскольку наши пользователи — продавцы. Для новой задачи почти никогда нет готовой разметки, её приходится собирать с помощью асессоров. Вы будете участвовать в составлении инструкций для асессоров и в борьбе за качество разметки, строить процессы автоматизации сбора таких данных.

Исследовать данные Маркета и делать выводы на их основе
Вам предстоит анализировать партнёрский контент — описание, параметры и прочую метаинформацию о товарах, а также историю прохождения конкретных товаров через внутренние бизнес-процессы, делать выводы об эффективности этих процессов и искать узкие места.

Мы ждём, что вы

  • Обладаете аналитическим складом ума
  • Разрабатывали нейросети с использованием PyTorch или другого фреймворка для работы с текстами
  • Понимаете принципы работы распределённых вычислительных систем, работали со стеком Hadoop (Spark, Hive)
  • Знаете классические алгоритмы и структуры данных
  • Способны самостоятельно искать и находить ответы на вопросы, разбираться в сложных системах и сервисах, читая код и документацию
  • Хорошо знаете SQL, умеете писать сложные запросы
  • Способны быстро обучаться и воспринимать большой объём новой информации

Будет плюсом, если вы

  • Стремитесь учиться и развиваться в области анализа данных
  • Имели опыт продакшн-разработки на Java
  • Работали системным аналитиком
  • Знакомы с системами Unix

Что мы предлагаем

  • Официальное трудоустройство
  • Современный офис с парковкой и всем необходимым для комфортной работы и отдыха
  • Вакансию в команде талантливых экспертов, у которых можно многому научиться и перенять полезный опыт, в компании с развитой культурой открытости и взаимопомощи: у нас работают увлечённые люди, которые любят своё дело и всегда готовы помочь
  • Компенсацию оплаты питания на территории офиса и в его окрестностях
  • Гибкий график, возможность частично удалённой работы: главное — это результат
  • Расширенную программу ДМС со стоматологией, обследованиями, вызовом врача на дом, оплату 80% стоимости ДМС для супругов и детей
  • Достойный доход и премии каждые полгода для всех, кто работает эффективно
  • Возможность участвовать в образовательных программах, лекциях, митапах Яндекса
  • Возможность быстро увидеть результаты своей работы в продукте, которым пользуются миллионы людей вокруг

Ключевые навыки

Libtorch (pytorch c++ api)
Apache hadoop
Catboost

Контактная информация

Яндекс

Сайт: не указан

Почта: не указана

Вакансия опубликована 16.05.2024 в г. Москва.

Похожие вакансии

#

Не указана

Москва

Гибкий график

МТС Digital — единый центр технологического развития экосистемы МТС. У нас работает больше 8000 сотрудников по 18 направлениям технологического развития.

Мы знаем, как поддержать баланс между работой и жизнью, разбавить рутину и создать вдохновляющую атмосферу...

19 июня

#

Не указана

Москва

Аэропорт

и еще 2 станции

Полный день

RUTUBE - крупнейший российский видеохостинг, где собраны различные категории видео: премьерные выпуски шоу и сериалов, прямые эфиры телеканалов, фильмы и мультфильмы, контент видеоблогеров.

Мы стремимся сделать лучший видеосервис на базе высокотехнологичных решений, исследований и аналитики, который позволит смотреть качественный лицензионный контент, адаптированный под каждого пользователя...

13 мая

#

Москва

Пушкинская

Полный день

SENSORIUM - этот цифровой медиахолдинг, который открывает новые горизонты потребления контента.

Компанияразвивает инновационные проекты, находящиеся на грани медиа и технологий, формирует новую систему взаимодействия между бизнесами и аудиторией – мы становимся связующим звеном, соединяя оффлайн и онлайн рынки развлечений и расширяя экономическую модель...

3 июня