Привет! Альфа-Деньги — это команда единомышленников, стабильная растущая финтех-компания. Мы — часть большого холдинга Альфа-Банка со своим независимым подходом к ведению бизнеса. Вместе мы создали лучший финансовый сервис для миллионов клиентов. Обязанности Мы строим системный мониторинг в финтех-продукте 24/7 и формируем мониторинг как сервис для всей компании. Нам нужен инженер, который станет частью ядра reliability-команды и поможет выстроить архитектуру наблюдаемости с нуля до зрелого уровня. Архитектура observability Совместное проектирование архитектуры мониторинга (Grafana LGTM: Loki, Mimir, Tempo, Prometheus). Развитие мониторинга как сервиса для продуктовых и инфраструктурных команд. Внедрение и развитие OpenTelemetry. Подключение сервисов к сбору метрик, логов и трейсов. Настройка exporters, агентов и интеграций. Формирование стандартов телеметрии и требований к инструментализации сервисов. Поддержка подхода Monitoring as Code: хранение конфигураций в Git, работа через PR и code review. Метрики, SLI/SLO и алертинг Проектирование SLI/SLO для ключевых технических и бизнес-флоу. Формирование метрик для критичных участков (скоринг, платежи, интеграции, очереди и др.). Пересборка алертинга на основе реального impact, а не технических триггеров. Снижение alert noise и устранение ложных/дублирующих срабатываний. Написание и оптимизация PromQL и LogQL. Автоматизация типовых задач мониторинга (шаблоны алертов, стандартизация конфигураций). Инциденты и постмортем Подключение к инцидентам для технического анализа. Работа с метриками, логами и трейсам в рамках RCA. Формирование технических action items по итогам постмортемов. Внедрение изменений в мониторинг, предотвращающих повторение инцидентов. Анализ повторяющихся проблем и системных деградаций. Дашборды и аналитика Построение дашбордов с нуля под конкретные сервисы и бизнес-процессы. Создание аналитических витрин для анализа деградаций и трендов. Корреляция метрик, логов и трейсов для поиска узких мест. Формирование прозрачной картины состояния системы для SRE и бизнеса. Развитие reliability-культуры Участие в формировании стандартов мониторинга и алертинга. Помощь командам разработки в корректной инструментализации сервисов. Предложение и реализация архитектурных улучшений observability-стека. Совместная работа с SRE и Incident Manager по снижению incident rate. Требования Технические навыки Уверенная работа с Prometheus и Grafana. Умение писать сложные PromQL и LogQL-запросы. Опыт построения дашбордов с нуля. Понимание принципов работы метрик, логирования и распределённых трейсов. Опыт настройки exporters и интеграций. Понимание OpenTelemetry. Базовое понимание Docker. Понимание Git и работы с конфигурациями через репозитории (PR, review, ветвление). Системное понимание Понимание распределённых систем и high-load архитектуры. Понимание latency, error rate, traffic, saturation. Понимание очередей, БД и сетевого взаимодействия на уровне диагностики. Опыт работы с Sentry, Zabbix — как плюс. Мышление и подход Инженерное мышление: умение искать первопричину, а не симптом. Способность работать с незрелой системой и постепенно доводить её до стандарта. Интерес к построению архитектуры, а не только к операционной части. Готовность брать ответственность за улучшения и доводить их до результата. Будет большим плюсом Опыт внедрения SLI/SLO с нуля. Опыт системного снижения alert noise. Участие в postmortem и RCA. Опыт автоматизации процессов мониторинга. Опыт работы в финтехе или 24/7-продукте. МЫ: Соблюдаем ТК РФ: Официальное трудоустройство в штат компании по ТК РФ; Предлагаем гибкий формат работы: Возможность удалённо работать; А если тебе захочется поработать офлайн — в твоём распоряжении офис в Москве в урбанистическом стиле, в одной минуте ходьбы от м. Технопарк; Заботимся о здоровье: С первого дня работы ты можешь выбрать расширенную программу ДМС со стоматологией; Доплата по больничному листу до оклада до 5 рабочих дней в год; Линия психологической поддержки; Врач в офисе и массажные кресла (для сотрудников в Москве); Бесплатные посещения фитнес-клуба А-sport на ст. м. Технопарк; Профессионально развиваемся: Корпоративная программа профессионального обучения совместно с Альфа Групп (внутренние и внешние программы); Возможность участия в профильных конференциях; Онлайн-библиотека; Карьерное развитие. Ты развиваешься и растешь вместе с командой; Программа наставничества; Профессиональные коммьюнити; Думаем о каждом: Кафетерий льгот через 6 месяцев – выбирай то, что важно тебе: спорт, организация рабочего места, здоровье, дети, питомцы, благотворительность и др; Корпоративные мероприятия и тимбилдинги в онлайн и офлайн формате; Подарки к праздникам и материальная помощь по особым случаям; + 3 дня 100% оплачиваемых day off в году. Интересна вакансия? Отправь отклик! Мы внимательно рассмотрим твое резюме и, если случится мэтч, обязательно свяжемся :)
Похожие вакансии
Договорная
Москва. Станции метро: Технопарк
Страховая компания Сбербанк страхование