other

Site Reliability Engineer ( Инженер по надежности сайта )

28 апреля 2026

От 200 000 руб.

Город: Москва. Станции метро: Электрозаводская

Айти Базис

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности:

HOSTKEY ​​​​​​​ищет Site Reliability Engineer (SRE), который возьмёт на себя надежность сложной инфраструктуры. Нам нужен инженер, способный не просто реагировать на сбои, а выстраивать систему так, чтобы их предотвращать: от внедрения SLI/SLO до глубокой отладки сети внутри Kubernetes. Вы будете тем человеком, который сделает мониторинг прозрачным от фронтенда до очереди RabbitMQ, а деплой - бесшовным для тысяч WebSocket соединений.Основные задачи: Внедрение SLI/SLO, управление инцидентами, участие в on-call ротации, проведение постмортемов. Построение сквозного мониторинга цепочки Фронт → Бэк → Очередь → WebSocket. Стек: VictoriaMetrics + Grafana + Sentry. Глубокая работа с Kubernetes (сетевые политики, лимиты, отладка подов). Продвинутая настройка Nginx под долгоживущие WebSocket-соединения. Администрирование MinIO в Distributed Mode (Erasure Coding, обновления без простоя). Тюнинг производительности MariaDB / ClickHouse / Redis (индексы, тяжелые запросы, репликация). Эксплуатация RabbitMQ: кластеризация, мониторинг лагов, ретеншн. Развитие GitLab CI/CD (сложные пайплайны, канареечные деплои, blue/green). Участие в миграции PHP-приложения с php-fpm на persistent runtime (RoadRunner / FrankenPHP). Требования: Опыт SRE/DevOps от 3 лет в production-среде с реальной нагрузкой. Kubernetes не на уровне kubectl apply, а с пониманием сетевых политик и отладки проблем. Nginx: уверенное проксирование WebSocket-трафика и балансировка долгих соединений. Уверенный Linux: tcpdump, strace, анализ сетевой подсистемы. Опыт работы с очередями (RabbitMQ / Kafka). Опыт администрирования объектных хранилищ (MinIO / Ceph). Понимание ограничений классического php-fpm и готовность работать с современными рантаймами (RoadRunner, FrankenPHP). Мы предлагаем: Полноценная удаленная работа из любой точки мира. Работа в аккредитованной IT-компании. Полный день 10:00–19:00 МСК, 5/2 (гибкое начало рабочего дня). Интересные высоконагруженные задачи и дружный профессиональный коллектив.

Показать контакты

Имя не указано

Пожаловаться ID: 153289097

Похожие вакансии

Site Reliability Engineer

Договорная

Москва. Станции метро: Электрозаводская

Т-Банк

Site Reliability Engineer (SRE)

Договорная

Москва. Станции метро: Электрозаводская

Т-Банк

Site Reliability Engineer (SRE)

Договорная

Москва. Станции метро: Электрозаводская

Astrum Entertainment

DevOps Site Reliability Engineer / SRE

Договорная

Москва. Станции метро: Электрозаводская

Росгосстрах

Site Reliability Engineer в HotBox S3

Договорная

Москва. Станции метро: Электрозаводская

VK

DevOps/Site Reliability Engineer/SRE (HOME Platform and OS)

Договорная

Москва. Станции метро: Электрозаводская

СБЕР