Компания Nexpanse создает мобильные B2C продукты на базе generative AI технологий.
Мы ищем ML Dev Ops инженера, который сможет:
- Деплоить и поддерживать LLM-модели
- Обеспечить стабильную работу Front/Back сервисов web и мобильного приложения
Что нужно делать
- Разрабатывать и поддерживать конвейеры CI/CD для моделей машинного обучения
- Автоматизировать процессы развертывания и мониторинга моделей LLM в prod/stage
- Оптимизировать производительность моделей в микросервисной инфраструктуре
- Проводить нагрузочные тестирования
- Управлять версиями моделей и их конфигурацией
- Оптимизировать расходы на содержание AI инфраструктуры
- Внедрять и поддерживать практики MLOps для обеспечения эффективной работы всей команды
- Выстраивание high availability безопасной инфраструктуры
Требования:
- Опыт работы с AI/ML-решениями в проде
- Уверенное знание Python
- Умение работать с инструментами контейнеризации (Docker, Kubernetes)
- Опыт разработки и внедрения CI/CD конвейеров
- Знание облачных платформ (AWS, GCP, Azure) и опыт работы с ними.
- Опыт работы с инструментами мониторинга и логирования (Prometheus, Grafana, ELK stack и т.д.)
Будет плюсом
- Опыт работы с FastAPI / LangChain / LLM-сервисами
- Опыт работы с Airflow и умение выстраивать DWH пайплайны
Преимущества
- 100% удаленная работа
- Интересные проекты и задачи
- Компенсация расходов на фитнес
- Юридическая помощь в релокации
- Конкурентоспособная заработная плата
- Прозрачная система мотивации, ориентированная на результат
- Перспективы карьерного роста
- Работа над международными проектами