«Наносемантика» — ведущий разработчик технологий искусственного интеллекта.
Мы являемся крупнейшим игроком российского рынка ИИ-решений.
Наши компетенции: нейронные сети, голосовые роботы и системы анализа больших данных.
Мы разрабатываем гибридные решения, использующие как нейросетевые архитектуры, так и классические алгоритмы машинного обучения и анализа данных.
В свою дружную команду мы приглашаем специалиста Data Scientist NLP (уровня Middle/Middle+):
Чем предстоит заниматься:
- -Разработкой и внедрением решений на основе трансформеров для задач типа Text Classification, Token Classification, Text Generation и классических алгоритмов машинного обучения;
- Регулярным код-ревью 1–2 джунов и ситуационным наставничеством;
- Развертыванием моделей машинного обучения в виде сервисов с использованием FastAPI, Docker и инструментов Model Serving;
- Презентацией промежуточных результатов коллегам и заказчикам;
- Поиском решений инженерных и исследовательских задач в ходе проектов;
- Построением и отладкой пайплайнов извлечения и предобработки данных, обучения и инференса моделей;
- Выполнением необходимых интеграций с внешними сервисами;
- Разбором статей и реализацией архитектур нейронных сетей, функций потерь и оптимизаторов.
Мы ожидаем:
- Опыт работы: 2+ лет;
- Подтвержденный опыт решения задач NLP;
- Культура организации воспроизводимых экспериментов;
- Свободное владение Python 3 и навык писать читаемый код;
- Практический опыт работы с FastAPI, Docker, Git;
- Уверенное понимание процессов развертывания моделей;
- Отличные коммуникативные навыки и умение работать в команде;
- Хорошая математическая база и алгоритмы;
- Опыт работы с PyTorch (также плюсом будет TensorFlow/Keras);
- Понимание работы механизма внимания, энкодеров/декодеров, sequence2sequence моделей и хорошее представление о нейросетевых архитектурах BERT, GPT, T5;
- Понимание и опыт практического применения алгоритмов машинного обучения (sklearn, xgboost и пр.);
- Базовые навыки работы с библиотеками для обработки текстов (nltk, pymystem, pymorphy, spacy, natasha);
- Опыт автоматизации обучения моделей с помощью Apache Airflow.
Будет плюсом:
- Опыт работы с индустриальными системами аннотирования данных и сопровождения группы разметки;
- Опыт использования Explainable AI на табличных и текстовых данных;
- Подкованность в русскоязычных датасетах, знание их особенностей и недостатков;
- Опыт квантизации моделей;
- GitLab CI/CD и k8s;
- Участие в соревнованиях по машинному обучению.
Мы предлагаем: - Профессиональный рост и развитие через обучение и поддержку со стороны команды;
- Возможность работать с высококвалифицированными специалистами;
- Возможность осваивать новые технологии и повышать уровень своих навыков;
- Адекватное руководство, отсутствие бюрократии;
- Оформление по ТК РФ с первого рабочего дня;
- Полностью официальная заработная плата: оклад по результатам собеседования;
- ДМС для сотрудников (включая бизнес стоматологию);
- Испытательный срок - 3 месяца;
- Соблюдение норм ТК РФ.
Что ждёт интересного:
- Молодой коллектив, интересная и динамичная работа;
- Возможность получения льгот (компания имеет it-аккредитацию);
- Возможности для профессионального и карьерного роста;
- Возможность посещения профильных мероприятий - конференции и прохождение курсов, необходимые сотруднику для развития.