Оплата не указана
Вакансия находится в архиве
Требуемый опыт работы
От 1 года до 3 лет
Тип занятости
Полная занятость
График работы
Полный день
Embedika — научно-ориентированная ИТ-компания, разработчик систем поиска и анализа документов на основе data science технологий.
Разрабатываем интеллектуальные продукты для Legaltech (не только, но фокус в эту сторону), причем очень успешно. Проводим ресёрч и конференции вместе с Центром больших данных в МИСиС и запустили совместно с ними DS-магистратуру - там даже можно почитать гостевые лекции, если захочется.
На данный момент у нас планируется рост по проектам и продуктам, сейчас мы усиливаем направление R&D и ищем в команду ML-engineer.
Что предстоит делать:
Разрабатывать NLP-модели (Классификация, NER, тематическое моделирование)
Писать микросервисы для упаковки ML-моделей (активно работаем с Docker)
Разрабатывать рекомендательные системы на крупном проекте
Разрабатывать системы дообучения и автообучения ML-моделей на обновляющихся в процессе опытной эксплуатации данных (автоматическая замена весов моделей в Проде по запросу пользователя)
Взаимодействовать с командами Тестирования/DevOPS/Стейкхолдерами от бизнеса (по запросу объяснить сложное простыми словами)
Участвовать во внутренних конференциях, обмен знаниями с участниками ресёрч команды
Наши технологии: Python, PyTorch, Transformers, Onnx, Flask, Docker, Gitlab-CI, Nexus, DVC, S3, Kubernetes, Supervisord
Чего мы ждем от кандидата:
Опыт работы в области NLP от 1 года
Опыт обучения и файнтюна моделей на задачи NLP и работы с эмбеддингами (Word2Vec, fastText, BERT)
Хороший математический бэкграунд: понимание основных методов статистики, алгоритмов машинного обучения, структур данных
Уверенное программирование на Python
Знание основных библиотек для анализа данных, включая NumPy, Pandas, Matplotlib, sklearn + XGBoost / LightGBM / CatBoost, Transformers
DeepLearning: PyTorch, ONNX
Умение писать оптимальный по памяти и времени код
Базовые знания Linux
Опыт или желание освоить работу с Docker, DVC
Образование в сфере компьютерных/технических наук – МГУ, МФТИ, ВШЭ, кафедры и специальности по направлению «машинное обучение» или смежные (не ниже бакалавра)
Знание Git, Docker
Опыт работы с Jira, Confluence (опционально)
Английский не ниже Intermediate (нужно уметь читать научные статьи)
Возможности:
Разработка ML-моделей “под ключ”, весь пайплайн от предобработки данных и обучения моделей до сборки сервиса тестирования и внедрения в прод
Команда разработчиков, рядом с которыми интересно расти и работать
Работа с большим количеством сервисов разных тематик
Работа с семантическим моделированием
Сейчас стартовали разработку сервисов на базе генеративных сетей - отличная возможность “быть в тренде”
В планах решение задач суммаризации
Мы предлагаем:
Работу с крупными заказчиками. Разрабатываем крупные интеллектуальные системы для автоматизации бизнес-процессов наших заказчиков
Персональное предложение по зарплате в зависимости от уровня опыта и навыков
Мы аккредитованная it компания
Широкая зона ответственности, отсутствие границ в профессиональном и карьерном развитии
Нет бюрократии, прозрачное и понятное решение вопросов
Компетентное руководство, которое находится на передовой современных технологий
Комфортный график работы, возможность полной удаленной работы
Компенсируем обучение и конференции
ДМС со стоматологией и страховкой ВЗР
Доверие в команде и качественная обратная связь
Комфортный офис в центре с безлимитным кофе, фруктами, йогуртами на ваш вкус
Прокачка личного бренда (публикуем статьи, отправляем на конференции, чтение курсов для магистров по желанию)
Ключевые навыки
Контактная информация
Эмбедика
Сайт: embedika.ru
Почта: info@embedika.ru
Вакансия опубликована 17.03.2024 в г. Москва.
Похожие вакансии
Не указана
Москва
Алтуфьево
Полный день
Подробное описание
19 марта
Екатеринбург
Полный день
Подробное описание
28 июля