Senior Site Reliability Engineer (SRE)

3 ноября 2024

З/П не указана

Город: Санкт-Петербург

Codex Optimus

Город: Санкт-Петербург

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Codex Optimus

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности:

Мы — цифровой банк в Узбекистане. Быстрый и надёжный. Хотим сделать лучший финансовый сервис для людей и бизнеса. В нашей команде — разработчики с опытом в финтехе, высоконагруженных системах и кибербезопасности. С нами комфортно работать и отлично отдыхать! Мы растём, поэтому ищем Senior SRE (Site Reliability Engineer). Удалёнка по всему миру или офис — если хотите. Что по задачам: Развитие систем мониторинга и алертинга: Создание дашбордов мониторинга работы сервисов и бизнес-процессов. Настройка алертов из разных источников, проработка планов эскалации. Консультация и помощь смежным командам по вопросам мониторинга. Incident & problem management: Дежурства в формате OnCall, реагирование на алерты, классификация и заведение инцидентов. Устранение сбоев в работе приложений и инфраструктуры, как самостоятельно, так и с привлечением коллег из смежных команд. Проведение Postmortem митингов и написание Postmortem. Расследование причин инцидентов, проработка мероприятий по повышению доступности сервисов, контроль выполнения этих мероприятий. Обработка клиентских обращений: Решение сложных кейсов и единичных сбоев в работе приложений, которые не смогли решить на 1 и 2 линии поддержки. Автоматизация решения таких сбоев. Проработка требований и постановка задач на разработку инструментов, которые позволят саппорту самостоятельно решать больше клиентских обращений без привлечения IT. Какие опыт и знания мы ищем: Опыт работы в роли SRE от 3-х лет. Понимание принципов SRE, практический опыт внедрения практик SRE. Опыт работы с системами мониторинга, алертинга, трассировки и логирования. Владение языком программирования для разработки скриптов автоматизации (Python, Golang и т.д.), умение разбираться в чужом коде. Навык troubleshooting в сложных распределенных системах. Понимание принципов и практический опыт построения отказоустойчивых систем. Опыт администрирования операционных систем Linux. Плюсы работать у нас: Возможность поучаствовать в формировании SRE направления в компании, выстроить процессы так, как они должны работать, а не так как сложилось исторически. Свобода в выборе инструментов для реализации поставленных задач. Как мы работаем: Дома или в офисе — главное, чтобы было удобно. Есть 2 офиса: в Санкт-Петербурге и Ташкенте. А ещё у нас есть аккредитация. Без микроменеджмента. Мы не трекаем рабочее время — просто пишем в чате, если будем не на связи и спокойно идём пить кофе. Отсутствие бюрократии. С хорошими людьми. Пятничная пицца, квизы и Counter-Strike. Официально и с заботой. Обсуждаем процессы, пробуем и внедряем новое. Любим учиться: курсы, конференции. Наш технологический стек: Мониторинг, алертинг, трассировка, логи: Grafana; Sentry; Elasticsearch; VictoriaMetrics; Zabbix. Инфраструктура: K8S; Docker; Rancher; Kafka; Nginx; Ansible. Код: Ruby on Rails 7; Github; ArgoCD.

Контакт:

Имя не указано

При звонке сообщите, что Вы нашли вакансию на Rabix.ru

Откликнуться

Разместить Резюме

Распечатать Пожаловаться ID: 121236567