О компании и команде
Anykey - аккредитованная сервисная IT-компания. Мы помогаем клиентам быстро и экономно улучшать свой бизнес при помощи IT. Наша компания сформировалась как ответвление холдинга по IT направлению в области финансовых, банковских и других операций. Компания является агрегатом финансового партнерства, мы работаем с ключевыми корпорациями, где вам предстоит заниматься разработкой, тестированием и сопровождением внутренних и внешних проектов.
Ожидания от кандидата
- Знание английского языка от уровня B1-B2
- График 4/3 4/4 5/2, возможно обсудить частично удаленный вариант сотрудничества
- Высшее образование (готовы рассмотреть также студентов последних курсов)
- Специальность по образованию - физико-математическая или техническая, в частности в области программирования
Формат: Офис / Гибрид
Команда: Внутренний R&D-отдел (CV, NLP, MLOps)
Инфраструктура: исключительно on-premise — собственные CPU/GPU-серверы и
Kubernetes-кластер; никаких облачных/SaaS-сервисов, все данные остаются внутри
периметра!
Стек: Python 3.11+, PyTorch, Hugging Face, Golang, Docker-k8s
Что предстоит делать
Коротко о задаче
OCR + KIE: извлекать структурированные данные из PDF-сканов
паспортов, счет-фактур и пр.
Перевод
Биометрия
Модерация
контента
MLOps
Построить пайплайн текст → другой язык (MT) и речь →
текст → перевод → субтитры (ASR + MT + subtitle).
Сравнивать лицо на низкокачественном фото документа с
селфи со смартфона.
Автоматически проверять, соответствует ли изображение
текстовому описанию (пример: «есть ли на фото футболист?»).
Упаковывать модели в сервисы (REST/gRPC), писать тесты,
метрики, поддерживать CI/CD в закрытом контуре.
Обязательные требования
● 2+ года коммерческого опыта в applied ML / CV / NLP.
● Английский B2 и выше — умение читать техническую документацию, писать
комментарии, тикеты, описания PR.
● Уверенный Python 3.11+ (typing, OOP) и базовые знания Golang либо готовность
освоить.
● PyTorch (или TensorFlow) и Hugging Face: fine-tuning, inference, оптимизация на
GPU/CPU.
● OCR: Tesseract, PaddleOCR.
● KIE: LayoutLMv3, Donut, TrOCR или аналоги (локальный fine-tune).
● ASR: Open-source Whisper, Vosk, Coqui STT.
● MT: MarianMT, M2M-100, OPUS-MT, T5, Argos Translate — всё локально.
● Face recognition: InsightFace (ArcFace), Dlib, FaceNet, MediaPipe.
● Мультимодальные/zero-shot модели: CLIP, BLIP-2, OWL-ViT (локальный inference).
● Контейнеры: Docker; оркестрация: Kubernetes (on-prem), Helm.
● Git, Linux, базовые принципы CI/CD и сетевой безопасности.
Будет плюсом
● Английский устная коммуникация на уровне B2+/C1 — участие в звонках, ability
to explain design decisions clearly
Участие в production-проектах на Golang (gRPC, concurrency).
● MLflow, DVC, Airflow, Kubeflow — трекинг экспериментов и оркестрация.
● Работа с облачными GPU-инфраструктурами (AWS SageMaker, GCP AI Platform,
Azure ML).
● Оптимизация моделей: ONNX, TensorRT, quantization, pruning.
● Знание стандартов потокового аудио (WebRTC, HLS).
● Опыт prompt-engineering / интеграции LLM (OpenAI, Llama 2/3).
● Публикации на Kaggle, участие в open-source.
Что мы предлагаем
● Задачи уровня R&D с возможностью влиять на выбор моделей и архитектур.
● Доступ к выделенным GPU-нодам и бюджет на облачные эксперименты.
● Оформление по ТК РФ, гибкий график, 28 дней отпуска.
● Прозрачная грейд-матрица и ревью каждые 6 мес.
Как проходит отбор
1. Созвон 15-20 мин с рекрутером — знакомимся.
2. Техническое интервью 60 мин - в офисе, очная встреча.
3. Домашная задача — небольшой прототип модели или сервиса.
4. Финальный call — оффер.