Embedika — научно-ориентированная ИТ-компания, разработчик систем поиска и анализа документов на основе data science технологий.

Разрабатываем интеллектуальные продукты для Legaltech (не только, но фокус в эту сторону), причем очень успешно. Проводим ресёрч и конференции вместе с Центром больших данных в МИСиС и запустили совместно с ними DS-магистратуру - там даже можно почитать гостевые лекции, если захочется.

На данный момент у нас планируется рост по проектам и продуктам, сейчас мы усиливаем направление R&D и ищем в команду ML-engineer.

Что предстоит делать:

Разрабатывать NLP-модели (Классификация, NER, тематическое моделирование)
Писать микросервисы для упаковки ML-моделей (активно работаем с Docker)
Разрабатывать рекомендательные системы на крупном проекте
Разрабатывать системы дообучения и автообучения ML-моделей на обновляющихся в процессе опытной эксплуатации данных (автоматическая замена весов моделей в Проде по запросу пользователя)
Взаимодействовать с командами Тестирования/DevOPS/Стейкхолдерами от бизнеса (по запросу объяснить сложное простыми словами)
Участвовать во внутренних конференциях, обмен знаниями с участниками ресёрч команды

Наши технологии: Python, PyTorch, Transformers, Onnx, Flask, Docker, Gitlab-CI, Nexus, DVC, S3, Kubernetes, Supervisord

Чего мы ждем от кандидата:

Опыт работы в области NLP от 1 года
Опыт обучения и файнтюна моделей на задачи NLP и работы с эмбеддингами (Word2Vec, fastText, BERT)
Хороший математический бэкграунд: понимание основных методов статистики, алгоритмов машинного обучения, структур данных
Уверенное программирование на Python
Знание основных библиотек для анализа данных, включая NumPy, Pandas, Matplotlib, sklearn + XGBoost / LightGBM / CatBoost, Transformers
DeepLearning: PyTorch, ONNX
Умение писать оптимальный по памяти и времени код
Базовые знания Linux
Опыт или желание освоить работу с Docker, DVC
Образование в сфере компьютерных/технических наук – МГУ, МФТИ, ВШЭ, кафедры и специальности по направлению «машинное обучение» или смежные (не ниже бакалавра)
Знание Git, Docker
Опыт работы с Jira, Confluence (опционально)
Английский не ниже Intermediate (нужно уметь читать научные статьи)

Возможности:

Разработка ML-моделей “под ключ”, весь пайплайн от предобработки данных и обучения моделей до сборки сервиса тестирования и внедрения в прод
Команда разработчиков, рядом с которыми интересно расти и работать
Работа с большим количеством сервисов разных тематик
Работа с семантическим моделированием
Сейчас стартовали разработку сервисов на базе генеративных сетей - отличная возможность “быть в тренде”
В планах решение задач суммаризации

Мы предлагаем:

Работу с крупными заказчиками. Разрабатываем крупные интеллектуальные системы для автоматизации бизнес-процессов наших заказчиков
Персональное предложение по зарплате в зависимости от уровня опыта и навыков
Мы аккредитованная it компания
Широкая зона ответственности, отсутствие границ в профессиональном и карьерном развитии
Нет бюрократии, прозрачное и понятное решение вопросов
Компетентное руководство, которое находится на передовой современных технологий
Комфортный график работы, возможность полной удаленной работы
Компенсируем обучение и конференции
ДМС со стоматологией и страховкой ВЗР
Доверие в команде и качественная обратная связь
Комфортный офис в центре с безлимитным кофе, фруктами, йогуртами на ваш вкус
Прокачка личного бренда (публикуем статьи, отправляем на конференции, чтение курсов для магистров по желанию)

ML engineer