Обязанности: Приём, анализ и обработка обращений в техническую поддержку (L2-уровень); Мониторинг состояния сервисов, инфраструктурных контуров и ключевых метрик производительности; Анализ логов: инфраструктурных, системных и прикладных — с использованием инструментов ELK, Grafana Loki и др.; Диагностика инцидентов, локализация причин сбоев, взаимодействие с командой развития; Обновление системного и прикладного программного беспечения в рамках регламентов эксплуатации; Проведение обновлений ОС (Linux) и патчей ПО в соответствии с регламентами эксплуатации (релизы, хот фиксы); Участие в релизном цикле: Подготовка к выводу изменений в прод; Контроль корректности развертывания и проверка работоспособности после релиза; проверка эксплуатационной и технической документации; Работа над улучшением SLA/SLO: анализ частоты и причин инцидентов, предложение и реализация мер по повышению надёжности; Автоматизация рутинных задач: написание скриптов, интеграция с системами мониторинга. Требования: Уверенное владение Linux (консоль, диагностика, базовые компоненты ОС);используемые дистрибутивы: Ubuntu Server, Astra Linux; Опыт работы с systemd, journald, tcpdump, strace; Понимание сетевых основ (TCP/IP, DNS, TLS); Навыки написания простых bash/python-скриптов; Понимание работы микросервисной архитектуры, умение работать и диагностировать Docker, K8s;Понимание жизненного цикла инцидента; Опыт работы с логами; Опыт настройки и работы с системами мониторинга Grafana, Prometheus, Zabbix; Базовый опыт работы с СУБД: - просмотр данных и логов; - выполнение точечных SQL-запросов (mySQL).Будет плюсом: Опыт работы с Active Directory и Keycloak (аутентификация, SSO, политики доступа); Системы хранения данных: - распределённые объектные хранилища (MinIO или аналоги); классические файловые и блочные хранилища; Серверы приложений и прикладные сервисы: принципы развертывания, обновления и мониторинга; Средства защиты веб-приложений: WAF (понимание назначения, базовые принципы работы); Услуги облачных провайдеров и хостинг-провайдеров: - базовое понимание моделей предоставления услуг (IaaS / PaaS); взаимодействие с поддержкой провайдеров при инцидентах. Наши технологии: Виртуализация: OpenStack Контейнеризация: Docker, Kubernetes (K8s) Хранилища: MongoDB, PostgreSQL, MinIO Управление доступом: Keycloak, Active Directory CI/CD и управление кодом: GitLab Мониторинг: Prometheus + Grafana, Zabbix Логирование: ELK-стек / Loki + Grafana Инструменты: Jira, Confluence Пожелания: Интерес и желание развиваться в сторону DevOps / SRE; Готовность разбираться в причинах проблем, а не только «закрывать тикеты».
Похожие вакансии