Обязанности: Взаимодействие с архитекторами, техлидами, разработкой, инфраструктурой — внедрение лучших практик в области стабильности, безопасности и CI/CD Разработка инструментов для повышения надежности информационных систем Обеспечение надежности, производительности и доступности сервисов на уровне SLA/SLO/SLI Реакция на инциденты, корректировка ошибок, восстановление работоспособности инфраструктуры, устранение сбоев и расследование их причин Активное участие в оперативном устранении инцидентов Повышение Observability приложений Проектирование, внедрение и поддержка метрик для мониторинга, помощь продуктовым командам в организации их метрик Развитие инфраструктуры, управление конфигурациями и обновлениями Поддержание актуальной документации по всей инфраструктуре Проектирование отказоустойчивых систем с учетом растущих нагрузок Исследование и внедрение новых инфраструктурных решений Автоматизация процессов развертывания и эксплуатации Ведение регулярной отчетности и ретроспективы Внедрение стандартов и best practices и повышение инженерной культуры команд Требования: Экспертное знание Linux и практик DevOps/SRE Экспертиза Redis, Kafka, Elasticsearch Практический опыт с Doker Опыт работы в высоконагруженных проектах Опыт построения CI/CD и практик непрерывной доставки Опыт с Terraform/IaC и автоматизации инфраструктуры Опыт в написании ролей в Ansible Опыт построения и тестирования Disaster Recovery планов Опыт эксплуатации Opentelemetry Опыт эксплуатации PostgreSQL, Oracle Database Умение документировать инфраструктуру и процессы Опыт работы с системами контроля версий Git Опыт работы с системами мониторинга Prometheus и Grafana, агрегаторами логов Splunk, ELK и Graylog Опыт работы с системами контейнеризации и оркестрации Docker и k8s Умение быстро принимать решения во время сбоя, не теряться и не сдаваться Будет плюсом будет: Владение одним из языков программирования: Python, Java и другие Условия: Аккредитованная it-компания Полное соблюдение ТК РФ: с нами вы будете уверены в стабильности заработной платы, оплачиваемых больничных и отпусках, в начислении стажа, налоговых и пенсионных отчислениях Чай, кофе, ДМС Конкурентный уровень заработной платы
Похожие вакансии
Инженер по обеспечению надежности (SRE)
Договорная
Москва. Станции метро: Сокольники, Преображенская площадь
Национальная система платежных карт
Senior SRE Engineer / Инженер по обеспечению надежности систем
Договорная
Москва. Станции метро: Сокольники, Преображенская площадь
ФГАУ НИЦ Телеком
От 200 000 до 300 000 руб.
Москва. Станции метро: Сокольники, Преображенская площадь
ТМГТ
Договорная
Москва. Станции метро: Сокольники, Преображенская площадь
«UZUM TECHNOLOGIES»