Data Scientist (классический ML, Антифрод)

Оплата не указана

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Удаленная работа

Мы делаем антифрод-систему для видеорекламы. Сейчас проект на старте, и нам нужен человек, который поможет построить ML-направление с нуля и будет готов развиваться вместе с продуктом.

Задачи:

  • Анализ потоковых данных HTTP-запросов и браузерных параметров (до 5 млрд строк в месяц)

  • Формирование признаков, выявление закономерностей и аномалий

  • Разработка и внедрение ML-моделей (классические алгоритмы) для оценки легитимности рекламных показов

  • Построение и автоматизация ML-пайплайнов (обучение, деплой, мониторинг)

  • Постоянное улучшение моделей и внедрение новых эвристик

Требования:

  • Опыт в Data Science / ML от 3 лет

  • Глубокие знания классических ML-алгоритмов: деревья решений, бустинг (XGBoost, LightGBM, CatBoost), регрессия, кластеризация, ансамбли, вероятностные модели

  • Уверенное владение Python и библиотеками: pandas, numpy, scikit-learn, xgboost, lightgbm, catboost, statsmodels, imbalanced-learn, matplotlib, seaborn, optuna, mlflow

  • Опыт работы с ClickHouse, SQL, S3, Apache Airflow

  • Навыки построения и поддержки ML в production (деплой, мониторинг качества)

  • Высшее образование (математика, прикладная математика, информатика)

  • Умение работать автономно, без микроменеджмента

❗️Будет плюсом, если:

  • Есть опыт в проектах антифрода / антибота / риск-скоринга

  • Есть опыт работы с потоками данных (Kafka, pub/sub)

  • Есть понимание MLOps-подходов и CICD для ML

  • Знакомы с ClickHouse на уровне продвинутой аналитики

Мы предлагаем:

  • Участие в создании антифрод-системы с нуля

  • Возможность влиять на архитектуру и подходы

  • Полностью удалённая работа

  • Отсутствие бюрократии, звонков и микроменеджмента

  • Долгосрочная перспектива, не проектная работа

  • Рост до ведущего специалиста или руководителя направления

  • Работа в компактной команде с высоким уровнем ответственности (Small Giant)

Ключевые навыки

Python (pandas, numpy, matplotlib)
Sql/mongodb/postgressql,clickhouse
Cpp-netlib
Django rest pandas
Sqlite
Python
Классическое машинное обучение
Scipy
Xgboost
Lightgbm
Catboost
Python (pandas, numpy, matplotlib)
Jupyter notebook
Геологическая разведка и интерпретация данных
Исследовательский анализ данных
Основы баз данных

Контактная информация

Житняков Денис

Сайт: не указан

Почта: не указана

Вакансия опубликована 01.05.2025 в г. Москва.

Похожие вакансии

#

Junior

Москва

Динамо

и еще 1 станция

Полный день

Подробное описание

21 апреля

#

Не указана

Москва

Удаленная работа

Подробное описание

23 апреля

#

Не указана

Москва

Зорге

и еще 1 станция

Полный день

Подробное описание

26 апреля