Data Scientist / ML-инженер (Big Data)

Оплата не указана

Вакансия находится в архиве

МТС

г. Москва

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Полный день

Big Data МТС – место, где телеком данные превращаются в реально работающие IT-продукты. Мы создали и протестировали несколько десятков сервисов. Самые успешные из них уже стали частью экосистемы МТС. Например, МТС Маркетолог, рекомендации в KION (МТС ТВ), услуга “Кто звонит?” или Спам blacklist.

Кого мы ищем?

Мы ищем Data Scientist’ов и ML-инженеров в следующие продукты:

  • Защитник (Middle+)

Защитник – это умная защита от нежелательных звонков, мы не просто определяем нецелевые звонки и блокируем, но и записываем их, расшифровываем, определяем категорию. Все для того, чтобы клиенты были спокойны.

  • HR RTK (Middle)

HR RTK решает задачи построения предиктивных моделей на каждом этапе ELV сотрудника для создания более эффективных процессов привлечения, адаптации, развития и удержания сотрудников

  • Детектор аномалий (Middle)

Продукт Детектор аномалий – это разработка системы интеллектуального сторителинга данных и мониторинга аномалий в распределении различных признаков, важных для телекома и экосистемы.

  • МТС Аналитика в ML команду (Middle+)

МТС Аналитика - это платформа для сбора и анализа данных о поведении пользователей, которая помогает компаниям принимать более обоснованные решения на основе данных.
Мы ищем Data Scientist в ML команду. Эта команда разрабатывает модели для определения рекламного антифрода, контекстуального анализа (текст и изображения) и идентификации.

  • Омниканальные коммуникации (Middle)

OmniChannel - платформа по интеграциям различных каналов общения с клиентами в единую коммуникационную систему. Наша платформа работает с повышенными требованиями к скорости - в 20 000 отправок в секунду и надежности более 9999.

  • Лидогенерация и отток B2B (Middle)

В продукте на основе данных из различных внутренних и внешних источников мы строим модели и сегменты, направленные на оптимизацию LTV клиентов B2B. Находим компании наиболее склонные к покупке услуг, развиваем текущих клиентов, находим компании склонные к оттоку, предоставляем бизнесу углубленную аналитику по поведению базы.

  • Скоринг (Senior-Lead)

Скоринг - это коммерческий B2B продукт, помогает определять кредитные риски и риски совершения мошенничества B2B-клиентам. Включает 2 основных направления: рисковый и антифрод скоринг. Рисковый скоринг определяет, вернет/не вернет абонент кредит. Антифрод скоринг выявляет склонность к мошенничеству.

  • Платформа Поиска (Middle)

Мы ищем ML-инженера, с которым мы будем вместе развивать платформу Поиска в МТС. Мы уже сделали несколько пилотов, которые подтвердили ценность для экосистемы МТС и мы готовы масштабировать наши наработки в группу компаний.

  • RTK Supply (Middle+)

Big Data RTK Supply. Наша команда занимается разработкой комплексного решения для динамического ценообразования и прогнозирования спроса в салонах продаж МТС. В настоящее время проводим пилотирование, а модель динамического ценообразования планируется развивать как платформу управления ценами для продуктов экосистемы МТС.

Обязательно:

  • опыт работы от 2-х лет в области анализа данных и машинного обучения
  • понимание, как работают ML-алгоритмы и не будете тратить время на эксперименты с заведомо плохими решениями
  • понимание, когда нужно остановиться и использовать вместо ML более простые и быстрые подходы
  • у вас продвинутые знания Python, в т.ч. основных ml-библиотек
  • умение делать препроцессинг данных на SQL или PySpark
  • умение работать с git
  • есть базовые навыки работы в Linux/Unix
  • знание минимум один из классических языков C, Java, Scala, C/C++/C# и есть опыт программирования в прошлом
  • опыт вывода ml-решений в продакшн

Что предстоит делать?

  • выгружать и готовить/обрабатывать данные (находить аномалии и инсайты)
  • перебирать гиперпараметры ml-моделей, пока кросс-валидация не даст нормальный результат :)
  • дорабатывать ml-модели из стандартных библиотек
  • проверять бизнес гипотезы в offline и готовить дизайн A/B тестов
  • доводить модель до прода совместно с разработчиками

Что вы найдете в команде Big Data?

Стек технологий:

  • работаем с данными на классическом hadoop-стеке (Spark, Hive)
  • разрабатываем на python3: R&D делаем в Jupyter, продуктивизируем в PyCharm
  • обучаем модели на отдельных мощных машинах с видеокартами Tesla V100
  • используем собственные разработки для скоринга больших данных и MLFlow для экспериментов
  • храним код в gitlab, CI/CD в Jenkins, процессы запускаем в Airflow

Команда: в команде Data Science сейчас 30 человек (во всей Big Data МТС более 300 человек). Все DS поделены на группы со своими лидами - есть группа рекомендательных систем, скоринга и другие. Каждую неделю мы обмениваемся опытом на совместных синках.

DS работают в продуктах со своей автономной командой, в которой есть все роли: аналитики, DE, DS, разработчики, девопсы, менеджеры продукта.

Условия: каждый месяц - аванс и зарплата, дважды в год - премия. ДМС + стоматология, корпоративная связь, специальные предложения от партнеров и друзей МТС, отпуск 31 день в год. Выдаем 16 MacBook Pro или Dell на выбор.

Есть ли обучение?

  • Локальные конференции, митапы
  • Корпоративный университет МТС и масштабная виртуальная библиотека
  • А ещё мы регулярно обмениваемся опытом на совместных синках с лидами экспертизы

Какой график? Гибкое начало рабочего дня в промежутке с 8 до 11. Есть возможность работать несколько дней вне офиса по договоренности с командой.

Ключевые навыки

Python
Machine learning
Data science
Математическая статистика
Version control/git

Контактная информация

МТС

Сайт: mts.ru

Почта: не указана

Вакансия опубликована 30.03.2024 в г. Москва.

Похожие вакансии

#

Не указана

Москва

Аэропорт

и еще 2 станции

Полный день

Подробное описание

1 июля

#

Москва

Полный день

Подробное описание

2 августа

#

Не указана

Санкт-Петербург

Полный день

Подробное описание

31 июля