Обязанности:
Omniverse — рекрутинговое агентство, состоящее из команды профи, которые помогают находить лучших сотрудников для крупных IT и Digital компаний. Наша цель — идеально сочетать ваши навыки и ожидания, чтобы помочь вам найти работу мечты. Один из наших основных клиентов — международный холдинг, который управляет 12 продуктами и запустил уже более 40 проектов, охватывающих десятки стран на всех континентах, сейчас ищет себе в команду Senior/Lead SRE. Основные задачи: 1. Разработка и интеграция: Участие в разработке и внедрении новых систем и сервисов. Создание внутренних инструментов для автоматизации и повышения эффективности работы. Активное участие в процессе проектирования архитектуры и выборе технологий. 2. Надежность и отказоустойчивость: Аудит надежности систем и разработка стратегий повышения устойчивости. Проектирование и внедрение высокоотказоустойчивой архитектуры. Разработка стратегий Disaster Recovery и обеспечения непрерывности бизнеса. Внедрение SLO (Service Level Objectives) и управление Error Budget. 3. Безопасность и соответствие стандартам: Поддержка высокого уровня информационной безопасности систем. Обеспечение соответствия систем нормативным требованиям и стандартам (GDPR, ISO, PCI DSS). 4. Оптимизация и масштабирование: Оптимизация производительности систем и сервисов. Планирование емкости и масштабирование инфраструктуры под потребности бизнеса. Оптимизация затрат на облачные ресурсы. 5. Автоматизация и процессы: Автоматизация процессов с использованием подходов IaC (Terraform, Ansible). Настройка и улучшение CI/CD процессов. Улучшение мониторинга, алертинга и быстрого реагирования на инциденты. 6. Инцидент-менеджмент: Реагирование на инциденты, проведение постмортемов и разработка предложений по улучшению. Участие в on-call дежурствах и оперативное реагирование на инциденты. 7. Взаимодействие и поддержка разработки: Тесное сотрудничество с командами разработки для повышения надежности и эффективности процессов. Интеграция лучших практик разработки в инфраструктурные процессы. Менторство и обучение команды, развитие инженерных практик. Документирование процессов и решений. Наши ожидания: Глубокие знания AWS и других облачных решений (Azure, Google Cloud, Yandex.Cloud и т.п.). Опыт работы с системами виртуализации и контейнеризации. Опыт работы с Kubernetes: управление, настройка, мониторинг и обеспечение отказоустойчивости приложений. Понимание архитектуры современных распределённых систем и умение применять лучшие практики проектирования. Опыт построения и управления геораспределённой инфраструктурой с использованием нескольких зон доступности (AZ) для Обеспечения отказоустойчивости и высокой доступности. Навыки backend разработки на Node.js и TypeScript. Опыт настройки и оптимизации CI/CD пайплайнов (например, с помощью GitLab CI и/или Argo CD). Умение строить надежные системы мониторинга, логирования и трассировки (Prometheus, Grafana, Jaeger и пр.). Опыт работы с базами данных (PostgreSQL, MySQL, Redis) и навыки их оптимизации. Знание брокеров и очередей сообщений (Kafka, Rabbit MQ, NATS) и опыт их интеграции. Отличное понимание DevOps-подходов и автоматизации инфраструктуры с помощью Terraform, Ansible и других IaC инструментов. Навыки устранения проблем в продакшне, участие в инцидент-менеджменте. Опыт планирования восстановления после сбоев и реализации стратегий Disaster Recovery. Опыт в оптимизации производительности систем, снижении затрат и планировании ресурсов. Отличные навыки коммуникации и лидерства, способность работать в команде и менторить младших инженеров. Будет плюсом: Опыт применения практик и инструментов Chaos Engineering. Знание других языков программирования (Python, PHP, Java, Kotlin, Go и т.д.). Опыт управления инфраструктурой в multicloud и hybrid средах. Опыт работы с serverless-архитектурами (AWS Lambda, API Gateway, S3 и пр.). Знания стандартов и практик соответствия требованиям (GDPR, ISO, PCI DSS). Понимание принципов информационной безопасности, управление доступами и секретами, опыт работы с DevSecOps практиками. Опыт миграции легаси-систем на современные технологии. Знания в области оптимизации высоконагруженных приложений. Для тебя: Дружная команда крутых специалистов и максимально комфортная рабочая атмосфера. Гибкое начало дня (с 9 до 12 по МСК). Полностью оборудованное рабочее место. Возможность полностью удаленной работы. Официальное трудоустройство. ДМС со стоматологией после испытательного срока. Частичная компенсация курсов английского языка и занятий в фитнес-зале. Зоны отдыха с игровыми приставками, настольным теннисом, кикером, самокатами и кухней. Доступ к корпоративной библиотеке. Корпоративы с выездами на природу и призами, тимбилдинги, мастер-классы и тд. Релокационный пакет и возможность получения отсрочки от призыва на мобилизацию.