Аналитик данных

Оплата не указана

Вакансия находится в архиве

VK

Павелецкая

и еще 1 станция

г. Москва

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Полный день

Мы создаём самую большую рекомендательную систему в России, выпускаем приложения под Android и iOS, разрабатываем редактор видео и помогаем интересным блогерам найти новую аудиторию, а пользователям — интересные публикации. За этим стоят сложные алгоритмы, сотни тестов и сервис, который обрабатывает 150 тысяч запросов в секунду.

Наша команда управляет контентом Дзена, ВКонтакте и Одноклассников. Для этого у нас более 80 ML-моделей в концепции Human in the loop. Также используем ChatGPT и три краудсорсинговые платформы разметки данных.

Ищем аналитика, который поможет усовершенствовать систему работы с потоками данных и операционную эффективность всей системы разметки.

Задачи:
  • выстраивать в Airflow оркестрацию потоков данных на разметку;

  • исследовать и визуализировать метрики контроля за пайплайнами;

  • находить точки роста для платформы разметки данных;

  • собирать, анализировать и интерпретировать информацию из разных источников с использованием математических моделей;

  • управлять «толпой» разметчиков через метрики, пайплайны и механики контроля качества;

  • развивать систему разметки с помощью LLM — ChatGPT и её аналогов.

Стек технологий: SQL для обработки больших данных, Python для работы в Airflow и расчёта метрик агентов разметки (ML-моделей, ChatGPT, Яндекс Толоки и так далее), Git — для CI/CD кода и пайпланов, BI-системы — для визуализации метрик.

Требования:
  • вы работали в Airflow и BI-решениях — Datalens, Superset, Power BI или другом;

  • имеете высшее техническое или математическое образование;

  • владеете Python для анализа данных — дружите с Pandas, Numpy и Catboost;

  • понимаете метрики ML-моделей классификации;

  • понимаете тервер и матстат для оценки метрики, которую невозможно посчитать точно;

  • стремитесь расширить свою экспертизу и строить ML-сервисы E2E — от понимания требуемых данных до мониторинга обученных моделей в проде.

Будет плюсом:
  • вы работали с Superset;
  • использовали краудсорсинговые платформы, например Толоку.

Адрес

Москва, Садовническая улица, 82с2

Контактная информация

VK

Сайт: не указан

Почта: не указана

Вакансия опубликована 14.05.2024 в г. Москва.

Похожие вакансии

#

Ижевск

Полный день

Почему нашим коллегам нравится работать в UDS?

UDS — застройщик, создающий будущее. 17 лет мы строим дома в Ижевске, Перми, Москве и Нижнем Новгороде. Мы создаем уютное место для счастливой жизни в кругу любимых людей. Соблюдаем мировые стандарты качества и уверены в своем продукте. Над каждым...

2 мая

#

Барнаул

Полный день

Привет! Мы, Киберия – активно развивающаяся команда опытных разработчиков веб-приложений. Мы работаем над долгосрочными и развивающимися онлайн-сервисами в области e-commerce, онлайн-образования, а также разработки CRM и ERP-систем.

Важно отметить, что на текущую должность рассматриваем кандидатов...

21 марта

#

Не указана

Москва

Беляево

и еще 3 станции

Полный день

Обязанности:

  • выполнение задач лаборатории молекулярной эпидемиологии возникающих инфекций.

Требования:

  • Минимально: высшее образование (мастер, специалист) - биологическое, медицинское, математическое. Знание методов математического моделирования, эпидемиологии (мультипараметрический анализ, Байесовы статистические методы). Опыт работы от 5 лет...

7 апреля