Обязанности:
Мы ищем Senior DevOps инженера в инфраструктурную команду для развития и поддержки высоконагруженных сервисов и внутренних платформ компании. Это hands-on роль с сильным уклоном в reliability engineering и инфраструктурную автоматизацию: вам предстоит развивать мониторинг, поддерживать и улучшать инфраструктуру, участвовать в расследовании инцидентов и помогать команде выстраивать инженерные практики вокруг стабильности и observability. Чем предстоит заниматься: Развивать и поддерживать системы мониторинга, алертинга и сбора метрик Выстраивать observability-практики совместно с командами разработки Настраивать и сопровождать Grafana, Prometheus, VictoriaMetrics Поддерживать и развивать инфраструктуру как код (IaC) с использованием Terraform и Ansible Участвовать в ревью инфраструктурных изменений и улучшении процессов эксплуатации Оптимизировать расходы на инфраструктуру и облачные ресурсы Помогать команде в расследовании и устранении инцидентов Проводить диагностику сетевых и инфраструктурных проблем Поддерживать Linux-инфраструктуру и внутренние репозитории Взаимодействовать с разработчиками по вопросам логгирования, метрик и reliability best practices Что для нас важно: Опыт работы в SRE/DevOps от 3 лет Опыт работы системным администратором, в L2/B2B support или смежной инфраструктурной роли на раннем этапе карьеры Хорошее понимание Linux (Ubuntu-based дистрибутивы) Практический опыт работы с Terraform и Ansible Опыт построения или серьёзного развития систем мониторинга Уверенные навыки работы с Grafana и Prometheus Понимание принципов Infrastructure as Code и организации инфраструктурных репозиториев Понимание сетевой модели TCP/IP и навыки диагностики сетевых проблем Опыт работы с облачными платформами (AWS, GCP, Azure) Навыки автоматизации на Python Понимание лучших практик эксплуатации и reliability engineering Хорошие коммуникационные навыки и готовность брать на себя лидерскую роль в будущем Будет плюсом: Опыт работы с VictoriaMetrics Опыт работы с модулями ядра Linux Базовые знания C Опыт оптимизации инфраструктурных расходов Опыт участия в incident response и postmortem-процессах Опыт построения мониторинга “с нуля” Опыт работы в высоконагруженных или распределённых системах Важно:По всем ключевым направлениям мы проводим глубокое техническое интервью — для нас важны не только знания инструментов, но и понимание принципов их работы, лучших практик и наличие реального практического опыта. Условия: Полная занятость Удалённый формат работы График 5/2 Конкурентная заработная плата Возможность влиять на инфраструктурные решения и процессы Перспектива роста в лид-инженера / тимлида DevOps направления Участие в развитии быстрорастущего проектаПохожие вакансии