Мы - финтех стартап с работающими продуктами. Ищем sre-инженера для усиления инфраструктурной команды.
У нас нет legacy систем и инфраструктуры, мы используем современные технологии и гибкие процессы в работе
Обязанности:
-
Управление инцидентами и их эскалация, оперативное решение проблем.
-
Деплой и обслуживание инфраструктуры на основе Kubernetes, Docker, Helm, Terraform.
-
Определение и контроль SLO (Service Level Objectives) и SLI (Service Level Indicators) для гарантии качества услуг.
-
Настройка мониторинга, определение критических параметров, настройка алертов и интеграция с системами оповещений.
-
Дежурство и оперативное реагирование на инциденты, проведение
постмортем-анализ
Требования:
- Опыт работы SRE-инженером от 2 лет
- Опыт сопровождения сервисов в k8s
- Понимание SLI / SLO и практик incident management
- Опыт настройки работы с zabbix или подобными инструментами
- Опыт работы с облаками (AWS, Yandex Cloud, Selectel)
- Опыт работы с реляционными БД
Условия:
- Оформление по ТК РФ
- Удаленный формат работы
- ДМС (после прохождения испытательного срока)