Обязанности:
Привет!LIFE PAY — это технологичная компания, использующая все современные подходы к ведению бизнеса. Мы предлагает эффективные IT-решения, которые помогают нашим партнерам работать с платежами и автоматизировать бизнес. Наши люди - наш главный драйвер. Здесь ты можешь влиять на процессы и предлагать свои решения: мы открыты для тех, кто хочет менять компанию к лучшему. И готовы вдохновлять их новыми интересными задачами. А еще мы про стабильность: за последние годы, включая кризисные периоды, мы не только сохранили команду, но и выросли в 4 раза. Работа в LIFE PAY - одно из лучших карьерных решений, что ты можешь принять. Сейчас мы ищем руководителя департамента инфраструктуры, которому предстоит лидировать и развивать несколько направлений. Команда: 30 инженеров, 6 направлений (DevOps, SRE, Network, Sysadmin/Helpdesk, Support Engineering, Data) Технологии: Yandex Cloud, Kubernetes, Terraform/Ansible, GitLab/GitHub CI/CD, Prometheus/Grafana, Vault/Secret Manager, Kafka/ClickHouse/Redis/Postgres, Linux, сетевые сервисы (BGP/IPSec/VPN), сертификация PCI DSS. Чем предстоит заниматься Построить и развивать инфраструктурную функцию: стратегия, бюджет, OKR/roadmap на 12 месяцев. Управлять 6 направлениями (лиды + команды), нанимать и развивать лидов/инженеров. Обеспечить надежность и масштабируемость платёжной платформы: SLO/ошибки/инциденты/каскады, capacity planning. Руководить SRE-практиками: error budgets, change management, postmortems без поиска виноватых. Эксплуатация и развитие Kubernetes-платформы (мультиклауд YC, multi-env, GitOps), сервис-меш/ingress/observability. Ответственность за безопасность/комплаенс в части инфраструктуры (PCI DSS), управление доступами (IAM/SSO), секретами и аудитом. Запуск/ведение ключевых программ: 2-й ЦОД/DR-стратегия, платформа CI/CD, Observability 2.0, FinOps (стоимость облаков), сетевые магистрали. Архитектурное лидерство: ревью решений, стандарты, RFC/ADR, техническая стратегия для DevEx. Вендор-менеджмент и закупки: контракты, SLA, бюджеты, оптимизация затрат. Минимальные требования (must-have) 7+ лет в инфраструктуре/платформенной разработке, 3+ года управления командами/лидами (20+ инженеров). Опыт эксплуатации продакшн-платформ на Yandex Cloud (VPC, IAM, LB, Managed DB, Object Storage, сети, безопасность). Сильный Kubernetes: дизайн/операции (control plane/worker), сервисы, сетевые плагины, HPA/VPA, Istio/ingress, Helm/Kustomize, GitOps (ArgoCD/Flux). Практика IaC (Terraform как основной инструмент) и CI/CD (GitLab/GitHub Actions/Jenkins), управление окружениями и релизами. SRE и производственная надежность: SLI/SLO, алертинг, capacity/профилирование, SLA с продуктами, управление инцидентами (on‑call, эскалации, postmortem). Глубокое понимание сетей (L3/L4, BGP, IPSec, VPN, балансировка/anycast), базовая безопасность (FW/WAF/IDS/segmentation). Опыт построения DR/BCP (backup/restore, RTO/RPO, репликации, холодный/тёплый standby, регулярные дриллы). Управление бюджетом/стоимостью (FinOps): прогноз, аллокации, оптимизация, отчётность COGS. Практики SDLC/DevEx: код-ревью, стандарты, миграции, change management, документация. Будет плюсом Финотраслевая специфика: PCI DSS, работа с регулятором, защищённые контуры. Эксплуатация multi-region/multi-cloud, гибрид с on‑prem/2-м ЦОДом. Языки: Go/Python для внутренних тулов, операторов, контроллеров. Observability-стек: Prometheus/Grafana/Loki/Tempo, OpenTelemetry, трейсинг, SLO-платформы. Опыт миграций (greenfield/brownfield), крупных инцидентов и кризис-менеджмента. Что предлагаем Работа в аккредитованной IT-компании. Полностью удаленный формат работы - работай откуда тебе удобно. График работы с 10.00 до 19.00 (Мск), гибкое начало рабочего дня. Комфортная техника для работы. ДМС и три оплачиваемых day-off в год. Обучение и участие в профессиональных конференциях.Похожие вакансии