Проект:
Мы - передовая высокотехнологичная команда создающая AI продукты для разработчика. Мы сделали GigaCode - AI-ассистент, ускоряющий написание программного кода. Поскольку мы продолжаем расти и все больше инженеров пользуются нашими инструментами, мы ищем к себе в команду талантливого Site Reliability Engineer с сильным опытом DevOps.
Описание позиции:
Как Site Reliability Engineer, вы будете играть решающую роль в обеспечении надежности, масштабируемости и производительности наших продуктов. Вы будете тесно сотрудничать с разработчиками, дата-сайнтистами и другими командами для проектирования, реализации и поддержки инфраструктурных решений. Ваше основное внимание будет уделяться оптимизации наших процессов разработки и развертывания, улучшению мониторинга и наблюдаемости систем, а также постоянной оптимизации инфраструктурного ландшафта.
Обязанности
- Проектировать, разрабатывать и поддерживать масштабируемую, надежную и безопасную инфраструктуру для наших продуктов.
- Внедрять инструменты для автоматизации выделения, конфигурирования, раскатки и мониторинга облачных и on-premisesинсталляций.
- Взаимодействовать с командами разработчиков программного обеспечения для оптимизации конвейеров CI/CD.
- Разработка и поддержка системы мониторинга и алертинга.
- Устранение неполадок и решения сложных технических проблем связанных с инфраструктурой, сетью и развертыванием приложений.
- Проведение регулярных оценок эффективности и надежности инфраструктуры, а также реализация стратегии для повышения отказоустойчивости систем.
- Быть в курсе лучших практик отрасли и новых технологий в SRE, DevOps и облачных вычислениях, MLOps. Внедрять их в команде.
- Быть настовиком для junior-инженеров и активно вносить свой вклад в инициативы по обмену знаниями и развитию навыков команды.
Требования
- Опыт работы с провайдерами облачной инфраструктуры, например, c AWS, Yandex Cloud, Cloud.ru или аналогичными. Прикладной опыт в построении и поддержки облачной инфраструктуры.
- Опыт работы с технологиями контейнеризации и оркестрации (Docker, Kubernetes).
- Знание принципов разработки программного обеспечения, опыт работы с системами управления версиями (Git), написания CI/CD пайплайнов и инструментов автоматизации (Jenkins, GitLab)
- Умение писать скрипты на одном из языков: Python, Bash.
- Понимание принципов и опыт работы с IaC и инструментами (Terraform and Ansible).
- Опыт настройки мониторинга и работы с инструментами: Prometheus, Grafana, ELK.
- Опыт администрирования БД: PostgreSQL, Redis.
- Отличные навыки решения проблем и проведения мероприятий по их недопущению. Сильные коммуникативные навыки и способность эффективно работать в быстро меняющейся agile-среде
Условия
- годовой бонус и ежегодный пересмотр зарплаты
- статус аккредитованной ИТ-компании со всеми преимуществами (ИТ-ипотека, отсрочка от срочной службы)
- расширенный ДМС с первого дня и льготное страхование для семьи
- корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
- офис с видом на набережную, зонами отдыха и спортзалом
- 90 дней удаленной работы из любого региона РФ
- льготная ипотека в Сбере, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.