Data Scientist (Operations)

Оплата не указана

Lamoda Tech

г. Москва

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Полный день

Мы в поиске Data Scientist в команду Operations.

Чем предстоит заниматься:

  • Решать задачи по пополнению стока, оптимизации хранения и умному управлению capacity интервалов доставки;
  • Предсказывать проблемы складского оборудования;
  • Развивать модели предсказания брака;
  • Проводить исследования и запускать пилоты для мультискладского управления запасами, оптимизации хранения и комплектации заказов.

Стэк технологий:Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch.

Почему у нас классно:

  • Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
  • Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
  • У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.

Мы ожидаем:

  • Опыт в области анализа данных и машинного обучения (от 2 лет);
  • Опыт работы с SQL, Hadoop, Hive, Spark;
  • Владение Python, Linux, методами работы с большими данными;
  • Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, CatBoost/XGBoost, PyTorch, Spark ML;
  • Знания теории вероятностей и математической статистики;
  • Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
  • Знание алгоритмов и структур данных;
  • Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
  • Английский язык на уровне технического чтения.

Как мы работаем:

  • Пишем на Python 3.6+ и PySpark 3.0;
  • Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
  • Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
  • Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
  • В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
  • Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
  • В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.

Ключевые навыки

Python
Pyspark
Big data
Machine learning

Контактная информация

Lamoda Tech

Сайт: не указан

Почта: не указана

Вакансия опубликована 01.07.2024 в г. Москва.

Похожие вакансии

#

Санкт-Петербург

Полный день

eLama - продуктовая IT-компания и один из крупнейших в России SaaS сервисов в сфере интернет-маркетинга.

Мы создали платформу, которая уже 15 лет упрощает работу с интернет-рекламой. В личном кабинет интегрированы различные рекламные системы, такие как Яндекс.Директ, VK Реклама, Telegram Ads и др. Пользователи могут запустить свою рекламу на всех этих...

1 апреля

#

от 150 000 ₽

Москва

Удаленная работа

Привет! В нашу крутую команду требуется Data Analyst с опытом работы в Digital Marketing. Если тебе интересно, то мы ждем твое резюме:)

Требования:

  • Высшее техническое образование;
  • Английский уровень В1-В2...

18 апреля

#

Москва

Полный день

Наша команда отвечает за улучшение контента с помощью аналитики. Мы фокусируемся как на метриках качества контента, так и на бизнес-логике и алгоритмах для ее улучшения, а также много взаимодействуем с технической командой контента.

Тебе предстоит...

1 июля