Обязанности:
Стабильность Авито зависит от слаженной работы тысячи сервисов, которые обновляются много раз в день. Иногда случаются инциденты, которые приводят к ухудшению опыта пользователя. В таком случае необходимо в кратчайшие сроки собрать команду, которая может решить инцидент, убедиться что все необходимые ресурсы у них есть и сохраняя высокий уровень прозрачности, помочь решить инцидент за минимальное возможное время. Таких людей мы называем Incident Manager, они работают в юните Incident & Problem Management. Основная задача Incident Manager - координация работ по устранению инцидента.Вам предстоит: Управлять решением инцидентов масштаба всего Авито: локализация проблем, призыв и координация дежурных, коммуникация до стейкхолдеров; Сопровождать технические работы: отработка рисков, контроль влияния на пользователей; Развивать процессы надежности на уровне компании — мы выступаем заказчиками инструментов траблшутинга, управляем процессом технических работ. Мы ждём,что вы: Обладаете опытом координации инцидентов в B2C/B2B-продуктах; Умеете работать с системами мониторинга, например Grafana, Kibana, Jaeger UI; Можете провести траблшутинг распределенной многокомпонентной системы (back-end, mobile, web). Работа у нас — это: Возможность реализовать свои идеи в проекте с многомиллионной аудиторией; Возможность увидеть, потрогать, пощупать весь технологический стек (тысячи серверов и микросервисов) Авито с первого дня работы; Работа в гибридном формате, основная часть команды в Москве, но готовы обсудить полностью удаленный формат из любой точки мира; Комфортные условия работы: ДМС, фитнес, компенсация питания; Возможность проходить обучение за счет компании, участие во внутренних митапах, хакатонах, тренингах.