Мы находимся в поиске руководителя направления эксплуатации, способного стать единой входной точкой для data-департамента в департамент эксплуатации - фасилитация бэк-лога, работа с ресурсами, архитектурная проработка и тд.
Задачи: - Создание необходимой ИТ-инфраструктуры (Dev / Test (IFT и LT) / Prod стенды) для нашего data-департамента, ее развитие и поддержка (capacity planning, disaster recovery planning);
- Планирование, организация работ и взаимодействие с data-департаментом;
- Участие в разработке и согласовании архитектурных решений;
- Управление изменениями, приоритетами и формирование бэклога задач data в OPS;
- Обеспечение необходимых ресурсов и ролей (Monitoring, SRE, DevOps, Ops, DataOps) для решения задач data-департамента;
- Контроль соблюдения этапов повышения технологической зрелости;
- Разработка и развитие процессов взаимодействия департаментов data и эксплуатации.
Требования: - Опыт работы в командах DevOps/DataOps/MLOps от 3-х лет;
- Опыт руководства командой от 5 человек;
- Опыт управления проектами - приветствуется;
- Отличные коммуникационные навыки;
- Опыт эксплуатации инфраструктуры в облаках (Cloud.ru/YandexCloud/AWX/GCP);
- Опыт эксплуатации ML/DS/DE платформ.
Наш стек:
- Kubernetes, Helm, GitLab CI, Flux, Nexus;
- HashiCorp Vault;
- Terraform/Terragrunt, Ansible;
- KeyCloak;
- Istio;
- Kafka;
- PostgreSQL, MongoDB, Redis;
- ELK stack;
- Prometheus, Grafana;
- Hadoop (HDFS, Hive, Spark, Ranger);
- kubeflow/clearML;
- Triton Server;
- Jupyter Lab;
- Airflow;
- Nginx Ingress Controller;
- Python, React;
- GraphQL, Apollo Federation;
- Java и Flink;
- Векторные базы данных (Qdrant).