Обязанности:
Мы стабильная и быстрорастущая финтех-компания, обеспечивающая надежную и безопасную обработку платежей для крупнейших бизнесов в России и СНГ. Наша миссия – сделать онлайн-платежи безопасными и доступными для всех, обеспечивая защиту от мошенничества и соблюдение строгих нормативных требований. Мы не просто обрабатываем транзакции, мы создаем системы, которые по могают бизнесам расти и развиваться в условиях динамично меняющегося рынка. В Finframe вы найдет е отличные возможности для карьерного роста, профессионального развития и участия в интересных и сложных проектах. Чем предстоит заниматься: Развертывание и эксплуатация систем наблюдаемости (метрики, алерты, логи, трейсы). Автоматизация деплоя систем наблюдаемости и построение различных service discovery. Разработка и внедрение дашбордов, правил алертинга. Анализ метрик, логов и трейсов для поиска узких мест и оптимизации производительности. Тесное взаимодействие с командами для внедрения best practices наблюдаемости. Участие в построении культуры обработки инцидентов. Мы ожидаем, что вы: Имеете понимание работы сетей и протоколов. Владеете навыками использования систем оркестрации (ansible) и понимаете принципы IaC. Умеете gitlab ci/cd. Фамильярны с docker. Глубоко понимаете концепцию Observability (метрики, логи, трейсы). Знакомы с PromQL, LogQL, LogsQL не по наслышке. Можете делать дашборды grafana самостоятельно. Пишете документацию/guidelines/runbooks Имеете опыт:- Работы DevOps/SRE-инженером с фокусом на мониторинг и повышение доступности нагруженных систем, работающих 24/7.- Планирования, развертывания и эксплуатации кластерных Prometheus, VictoriaMetrics.- Настройки и управления алертингом (Alertmanager, Telegram-боты).- Эксплуатации множества различных экспортеров/коллекторов. Будет плюсом: Опыт внедрения и эксплуатации полноценной платформы наблюдаемости для компании. Опыт внедрения распределённой трассировки приложений. Знание фреймворка SRE (SLI/SLO/SLA, error budgets). Опыт развёртывания и эксплуатации Grafana Loki, VictoriaLogs, Grafana Tempo, Sentry. Опыт эксплуатации и понимание работы СУБД (и приложений работающих с СУБД). Опыт работы с Kubernetes и понимание его метрик. Знание облачных провайдеров и их сервисов для мониторинга. Знакомы с различными бэкэндами для хранения данных наблюдаемости (clickhouse, scylladb, minio, итп). sentry. saltstack. statsd graphite clickhouse stack. Опыт разработки различных экспортеров/коллекторов для сбора метрик (bash, python, sql). OpsGenie. Что мы предлагаем: Официальное трудоустройство в соответствии с ТК РФ в аккредитованную IT-компанию. ДМС и страхование от несчастных случаев с первой рабочей недели, оплату больничных за первые 10 дней до 100% от оклада. Гибкий формат работы: Удаленная работа, либо гибридный формат работы в самом центре Москвы, в офисе по ул. Мясницкая, 16. Современная техника для работы (Macbook, мониторы, и все что вам нужно для комфортной работы. Возможность поработать в атмосфере небольшой уютной дружной компании, где все решается быстро, в дружеской обстановке и без бюрократии. Ежегодные корпоративы с компенсацией дороги и проживания . Присоединяйтесь к нашей команде и постройте успешную карьеру в перспективной и востребованной сфере!Похожие вакансии
Инфраструктурный инженер (Kubernetes / IaC / Observability)
Договорная
Москва. Станции метро: Лубянка
СберЗдоровье
Руководитель группы DevOps/SRE (Observability)
Договорная
Москва. Станции метро: Лубянка
«UZUM TECHNOLOGIES»
Технический продакт менеджер в Observability Platform
Договорная
Москва. Станции метро: Лубянка
Яндекс