Мы крупный университет. В части анализа данных у нас ведутся научные и прикладные работы по следующим направлениям:
- Анализ образовательных данных по заказу Правительства г. Москвы.
- Применение LLM в сфере образования.
- Применение технологий компьютерного зрения для сферы образования.
- Реализуются системы поддержки принятия решений на основе данных.
Обязанности:
- Развертывание и дообучение локальных LLM.
- Применение алгоритмов интеллектуального анализа данных (data mining) к образовательным данным.
- Применение алгоритмов машинного обучения для решения задач в области анализа образовательных данных.
- Сбор данных из внутренних баз данных и работа с внешними источниками информации.
- Визуализация данных.
- Развертывание созданных моделей машинного обучения и вывод в продуктовый контур.
- Взаимодействие с другими аналитиками данных.
Требования: Знания и навыки:
- Алгоритмы интеллектуального анализа данных и машинного обучения (регрессии, деревья решений, SVM, Random Forest, Нейронные сети и др.).
- Математическая статистика.
- Понимание принципов работы моделей-трансформеров.
- Знание SQL и умение писать сложные SQL-запросы.
- Понимание принципов и основ разработки API.
- Программирование на языке Python.
- Знания библиотек numpy, pandas, matplotlib, scikit-learn, xgboost, tensorflow, nltk/gensim и др.
- Умение работать с текстовыми данными, выполнять предобработку и последующий анализ.
Квалификация:
- Успешное участие в чемпионатах по машинному обучению (например, Kaggle) приветствуется.
- Наличие сертификатов в области машинного обучения, науки о данных, математической статистики, программирования на Python (например, сертификаты от Coursera, edX, Udacity) приветствуется.
Желательно:
- Опыт работы с Mixtral, LLaMA и др.
- Опыт работы с видео (применение существующих библиотек, разработка новых алгоритмов).
- Опыт работы с Docker.
Условия: - Местоположение офиса: м. ВДНХ/Ботанический сад.
- Официальное трудоустройство по ТК РФ.
- Конкурентная официальная заработная плата + бонусы по результатам проектов.
- Возможность удаленной работы.