Обязанности:
Привет! Я Катя, занимаюсь подбором в AWX и наконец-то пришел черед найти того самого DevOps-инженера в IT команду компании. Кто мы: AWX — международная финтех-платформа, создающая передовые решения для управления цифровыми активами и взаимодействия с ними. Наша миссия — дать пользователям инструменты, которые упрощают финансовые операции, повседневные финансовые задачи, делают их безопасными и прозрачными. Почему сейчас? Потому что твое время пришло... Потому что проект растет, а задачи становятся сложнее. Нам не достаточно «чтобы просто работало». Нужна надежность, автоматизация и спокойная уверенность в инфраструктуре. Почему это интересно: Зеленая зона: Никакого наследия (legacy). Сам выбираешь стек и архитектуру. Технический вызов: Highload, репликация Postgres, K8s, полная автоматизация бекапов и восстановления. 100% удаленка с гибким графиком (редкие дежурства по инцидентам). Чем предстоит заниматься (реальные задачи) Строить: CI/CD с нуля: Настроить GitLab CI, интегрировать с gitflow, написать пайплайны для Maven/pnpm, добавить SAST и линтеры; Оркестрация и БД: Поднять Kubernetes, настроить репликацию PostgreSQL (Master-Slave), обеспечить автоматическое восстановление; Наблюдаемость: Развернуть Prometheus + Loki + Grafana. Настроить алерты в Telegram так, чтобы мы узнавали о проблемах раньше пользователей; DevSecOps: WireGuard, файрволы, Network Policies в K8s, сканирование образов Trivy; Документирование: Писать runbooks и RCA (анализ инцидентов) — у нас культура «знания в коде и вики». Что для нас важно (Must have): Опыт: от 4 лет коммерческой работы DevOps в продуктовых компаниях (highload приветствуется); GitLab CI: Пайплайны, интеграция с gitflow, автоматизация билдов; Контейнеризация: Docker (безопасность, оптимизация слоев), Kubernetes (деплой, сетевые политики); Базы данных: PostgreSQL (репликация, бекапы/восстановление); Мониторинг: Prometheus + Loki + Grafana + Alertmanager; Скриптинг: Bash или Python для автоматизации бекапов; Network: Nginx (балансировка); Будет плюсом: CKA/CKAD, сертификаты по Prometheus/Grafana, опыт с Chaos Engineering (симуляция падений). Будет классно поймать и мэтч по софтам: Проактивность: Ты замечаешь проблему до алерта. Не ждешь задачу «настроить бекапы» — делаешь это автоматически; Дисциплина: После настройки сервиса сразу появляется страница в Wiki. RCA — в течение 24 часов после инцидента; Стрессоустойчивость: Во время аварии действуешь по чек-листу, восстанавливаешь сервис, а не ищете виноватых; Ответственность: Не бросаешь задачу на 90%. Доводишь до работающего алерта, бекапа и восстановления. Условия работы Удаленка: 100%, полная занятость; Занятость: полная, редкая работа в выходные при инцидентах (по согласованию); Зарплата: обсуждается с успешным кандидатом (рыночный уровень Senior DevOps); Команда: взрослые инженеры 30+, без микроменеджмента. Процесс отбора Интервью с HR (20–30 мин); Техническое интервью с CTO (глубокий разбор кейсов, архитектуры); Оффер.Похожие вакансии