Обязанности Мониторинг и контроль Круглосуточный мониторинг состояния инфраструктуры, сервисов и business-critical систем по дашбордам и алертам (Zabbix, Prometheus/VictoriaMetrics, Grafana, SCOM). Анализ трендов и превентивное реагирование на деградацию сервисов до перехода в инцидент. Инциденты Самостоятельное решение инцидентов уровня P2/P3 по runbook'ам без ожидания дневной смены. Реагирование на инциденты P1 с координацией эскалации на старшего инженера / архитектора / вендора. Ведение инцидентов в тикет-системе, post-mortem по согласованию с руководителем. Эксплуатация инфраструктуры Администрирование серверных ОС Windows и Linux (RHEL, CentOS, Ubuntu, Astra Linux SE) в рамках эксплуатационных задач: сервисы, патчи (по регламенту), логи, диски, сеть. Администрирование серверов виртуализации (Hyper-V или VMware vSphere) — управление ВМ, контроль кластера, базовая диагностика. Контроль и диагностика СУБД (MSSQL и/или PostgreSQL): проверка состояния, базовые запросы, эскалация при необходимости глубокого вмешательства. Контроль резервного копирования: статус заданий, восстановление по утверждённым инструкциям. Администрирование систем мониторинга (Zabbix, Prometheus/Grafana) — настройка алертов, дашбордов в рамках смены. Типовые и регламентные задачи Выполнение регламентных работ по чек-листам: перезапуск сервисов, контроль ресурсов, ротация логов. Выполнение и адаптация готовых скриптов на bash / PowerShell по инструкциям. Базовая диагностика middleware (Nginx, Redis, IIS, File Server) — перезапуск, анализ логов, эскалация при необходимости. Коммуникация и документирование Информирование заинтересованных сторон по регламенту. Фиксация всех действий в смене, актуализация runbook'ов. Координация с дневной командой при передаче смены. Требования Опыт работы от 3 до 5 лет в эксплуатации серверной инфраструктуры или системном администрировании. Администрирование Windows Server и Linux в production-среде. Опыт работы с системой мониторинга (Zabbix, Prometheus/Grafana или VictoriaMetrics). Администрирование виртуализации (Hyper-V или VMware vSphere), включая базовую работу с кластером. Опыт с СУБД (MSSQL или PostgreSQL) на уровне диагностики и эксплуатационных задач. Навыки написания и адаптации скриптов на bash или PowerShell. Опыт самостоятельного решения инцидентов в production-среде. Готовность к сменному графику 1/3. Ответственность, стрессоустойчивость, умение принимать решения в условиях давления, дисциплина документирования, обучаемость. Будет плюсом Опыт дежурств / сменной работы в NOC, ЦОД на business-critical системах. Администрирование SCOM, VictoriaMetrics. Опыт с SAN/СХД, Kafka, Redis, Ceph, Apache Airflow, BIND. Опыт с несколькими гипервизорами (Hyper-V + VMware, ProVZ, Proxmox VE, Альт PVE). Опыт автоматизации рутинных операций. Знание английского языка на уровне чтения профессиональной литературы. Высшее техническое образование. Сертификаты (MCSA, Linux+, VMware VCP и аналоги). Условия Работа в крупном системном интеграторе, с большим количеством различных задач. Удобное расположение офиса: шаговая доступность от ст. м. Белорусская — 5–7 минут пешком. Официальная заработная плата. График работы — сменный 1/3. Оформление по ТК РФ с первого рабочего дня. Оплата проезда по Москве.
Похожие вакансии
Дежурный инженер ИТ инфраструктуры
Договорная
Москва
Системный оператор Единой энергетической системы