other

Senior DevOps / Infrastructure Engineer — high-load DSP

Более недели назад

З/П не указана

Город: Москва

GloryTech

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности:

О нас: Peaklink — новая мобильная DSP (Demand Side Platform), которая занимается развитием инновационного продукта. Наша цель — создать платформу, которая станет лидером на рынке мобильной рекламы и поможет рекламодателям и издателям достичь новых высот. Почему мы? Возможность поучаствовать в создании нового продукта с нуля и внести свой вклад в его успех. У нас работают профессионалы своего дела, которые всегда готовы поделиться опытом и знаниями. Мы ценим инициативность, креативность и желание развиваться. Мы предоставляем все необходимые ресурсы для работы и профессионального роста. О роли: Вы берёте полную ответственность за production-инфраструктуру мобильной DSP (real-time bidding): обеспечиваете её стабильность и полную утилизацию имеющегося оборудования, а затем ведёте масштабирование до 100 000+ RPS. На этой роли нужно создавать прагматичные инженерные решения и балансировать между «надёжность / стоимость». Мы ищем самостоятельного Senior-инженера, который сам ставит и закрывает задачи и понимает систему достаточно глубоко. Чем предстоит заниматься? Стабилизация и полная утилизация production. Владение observability (Prometheus / Alertmanager / Grafana / Telegraf / Vector и exporters), проектирование осмысленных метрик и алертов, непрерывный поиск bottleneck и доведение их до устранения — инфраструктурные устраняете сами, по коду ставите точную задачу разработчикам; capacity planning. Масштабирование RPS на DSP. Рост throughput на текущем bare-metal, ведение архитектурного решения о дальнейшем масштабировании (гибрид k8s + bare-metal). Эксплуатация и деплой. Развёртывание и конфигурация C++-сервисов в нескольких инстансах, zero-downtime релизы через Ansible playbooks и GitLab CI; бесшовное обновление конфигураций. Базы данных и брокеры. Эксплуатация и поддержка стабильной работы ClickHouse, MySQL, Kafka, Aerospike. Внутренняя инфраструктура. Self-managed GitLab, Docker registry, runners; полноценный staging всей системы; движение к zero-trust и единому управлению доступом; резервное копирование и восстановление. Безопасность. Сетевая сегментация, управление доступом и секретами, TLS. Что мы от тебя ждем? Глубокое понимание DevOps / CI/CD и уверенная работа с Linux на уровне performance и networking (тюнинг под высокий RPS), а не только администрирования; Observability на уровне владения: Prometheus / Alertmanager / Grafana / Telegraf / Vector и exporters — проектирование метрик и алертов; Performance engineering: поиск bottleneck в high-load сервисах (CPU / IO / network / lock contention), способность отличить инфраструктурную проблему от проблемы в коде; Capacity planning и масштабирование высоконагруженных систем; Ansible (основной IaC-инструмент) и GitLab CI; Docker / Docker Compose в production; Nginx как high-load entrypoint: балансировка, rate-limiting, traffic-shaping, TLS / certbot, graceful reload; Операционный опыт работы с базами данных и брокерами: ClickHouse (MergeTree, partitioning / TTL, multi-disk storage policies, Kafka-engine и materialized views, ZooKeeper, диагностика медленных запросов), MySQL, Kafka, Aerospike; Системное мышление об экономике надёжности: обоснованный выбор, какие компоненты должны быть отказоустойчивыми, а где допустим короткий downtime ради экономии. Будет преимуществом: Опыт в AdTech / RTB — огромное преимущество (но также релевантен другой latency-sensitive high-load домен с высоким QPS поверх TCP, например fintech или биржевые системы); Владение AI-инструментами разработки (Cursor, Claude Code и аналоги) — большое преимущество; Kubernetes / Nomad в production и готовность обоснованно вести решение о выборе между горизонтальным масштабированием на bare-metal и миграцией в Kubernetes для гибридной системы; Понимание процесса C++ build / release (сборка Docker-образов, версионирование) — для совместной работы с разработчиками; Zero-trust / SSO (Keycloak), netbird; построение корпоративной сети; Airflow / ML-инфраструктура. Чем эта роль не является Не позиция on-call / поддержки по заявкам — мы ждём автономности и инициативы; Не разработка инфраструктуры с нуля в облаке — это гибридная bare-metal инфраструктура с приоритетом экономической эффективности; Не отказоустойчивость любой ценой — выбор уровня надёжности, оправданного экономически. Soft Skills Умение брать ответственность на себя и самостоятельно принимать решения; Гибкий подход к решению задач и способность быстро обучаться новым инструментам; Навыки планирования и приоритизации, умение эффективно распределять ресурсы; Коммуникабельность: способность взаимодействовать с разработчиками, менеджерами и другими участниками команды. Что мы предлагаем: Конкурентный уровень дохода; Гибкая система оплаты, включая зарплату в USD; Минимум бюрократии, максимум автономии и реального влияния на продукт; Возможность расти: участвовать в архитектурных решениях, выбирать инструменты, предлагать улучшения; Работу с современными технологиями в быстроразвивающейся AdTech индустрии; Удаленный формат работы из любой точки мира (при желании - офис в г. Москва).

Показать контакты

Имя не указано

Пожаловаться ID: 155475851

Похожие вакансии

Senior Product Owner (high‑load)

Договорная

Москва

Employcity

Senior DevOps / Senior DevOps Engineer

Договорная

Москва

CLICKLEAD

Infrastructure Security Engineer (DevOps)

Договорная

Москва

SberTech

Senior DevOps engineer

От 300 000 до 420 000 руб.

Москва

Клируэй Текнолоджис

Senior DevOps engineer

От 300 000 до 400 000 руб.

Москва

DigiKey Limited

Senior DevOps Engineer

Договорная

Москва

Rusprofile