Обязанности:
Привет! А ДЕНЬГИ — это команда единомышленников с гибким подходом к разработке финтех-продуктов. Мы — часть большого холдинга Альфа-Банка со своим независимым подходом к ведению бизнеса. Вместе мы создаем лучший финансовый сервис для миллионов клиентов. Не боимся рисковать, ищем новые решения и получаем прорывные результаты. Мы ищем Инцидент Менеджера для работы в полностью удалённом формате. Присоединяйся и создавай новую историю с нами! Чем предстоит заниматься: Мы ищем Incident Manager, который будет отвечать за управление инцидентами в продакшене end-to-end: от первого сигнала до внедрения улучшений после постмортема. Роль предполагает операционное лидерство, принятие решений в условиях неопределённости и ответственность за стабильность сервисов. Полный цикл управления инцидентами Координация всех этапов инцидента: обнаружение → реакция → восстановление → постинцидентный анализ. Организация и ведение War Room, распределение ролей (Incident Lead, технические эксперты, коммуникатор). Контроль выполнения SLA/SLO, снижение MTTR, MTTA, MTTT. Эскалация и оперативное реагирование Привлечение профильных команд (SRE, DevOps, разработка, инфраструктура, вендоры). Управление приоритетами и фокусом команд в условиях высокого давления. Принятие решений при неполной информации. Коммуникация и прозрачность Регулярные и понятные апдейты для стейкхолдеров, включая нетехнические команды и бизнес. Формирование итоговых отчётов по инцидентам (impact, timeline, root cause, action items). Постмортемы и улучшение процессов Проведение RCA с использованием 5 Why, Fishbone, FMEA. Контроль реализации action items по итогам постмортемов. Улучшение runbooks, алертинга, сценариев реакции, автоматизации. Развитие reliability-культуры Участие в обучении команд best practices работы с инцидентами. Участие в инициативах по повышению отказоустойчивости и снижению incident rate. Каким мы тебя видим: Опыт и мышление Опыт от 1 года в управлении инцидентами в высоконагруженных и распределённых системах. Умение структурировать хаос и принимать решения под давлением. Понимание процессов Incident / Problem Management (ITIL — на практике, не формально). Координация и коммуникация Опыт работы с кросс-функциональными командами 24/7. Чёткая письменная и устная коммуникация. Технический кругозор Понимание принципов работы: сетей, БД (PostgreSQL), брокеров и очередей (Kafka, Redis). Опыт работы с мониторингом и алертингом: Prometheus, Grafana, Zabbix (или аналоги). Умение читать метрики (latency, error rate, traffic) и логи. Метрики и анализ Знание и применение MTTR, MTTA, MTTT, SLA/SLO/SLI. Практический опыт RCA. Будет плюсом Опыт работы в SRE-подходе. SQL для несложных аналитических запросов. Опыт снижения alert noise и повторных инцидентов. МЫ: Соблюдаем ТК РФ: Официальное трудоустройство в штат компании по ТК РФ; Предлагаем гибкий формат работы: Возможность удалённо работать ; А если тебе захочется поработать оффлайн - в твоём распоряжении офис в Москве в урбанистическом стиле, в одной минуте ходьбы от м. Технопарк; Заботимся о здоровье: С первого дня работы ты можешь выбрать расширенную программу ДМС со стоматологией или компенсацию расходов на оплату спорта; Линия психологической поддержки; Врач в офисе и массажные кресла (для сотрудников в Москве); Бесплатные посещения фитнес-клуба А-sport на ст. м. Технопарк; Профессионально развиваемся: Корпоративная программа профессионального обучения совместно с Альфа Групп (внутренние и внешние программы); Возможность участия в профильных конференциях; Онлайн-библиотека; Карьерное развитие. Ты развиваешься и растешь вместе с командой; Программа наставничества; Профессиональные коммьюнити; Думаем о каждом: Корпоративные мероприятия и тимбилдинги в онлайн и оффлайн формате; Подарки к праздникам и материальная помощь по особым случаям; + 3 дня 100% оплачиваемых day off в году.Похожие вакансии