Обязанности:
О нас: Peaklink — новая мобильная DSP (Demand Side Platform), которая занимается развитием инновационного продукта. Наша цель — создать платформу, которая станет лидером на рынке мобильной рекламы и поможет рекламодателям и издателям достичь новых высот. Почему мы? Возможность поучаствовать в создании нового продукта с нуля и внести свой вклад в его успех. У нас работают профессионалы своего дела, которые всегда готовы поделиться опытом и знаниями. Мы ценим инициативность, креативность и желание развиваться. Мы предоставляем все необходимые ресурсы для работы и профессионального роста. О роли: Вы берёте полную ответственность за production-инфраструктуру мобильной DSP (real-time bidding): обеспечиваете её стабильность и полную утилизацию имеющегося оборудования, а затем ведёте масштабирование до 100 000+ RPS. На этой роли нужно создавать прагматичные инженерные решения и балансировать между «надёжность / стоимость». Мы ищем самостоятельного Senior-инженера, который сам ставит и закрывает задачи и понимает систему достаточно глубоко. Чем предстоит заниматься? Стабилизация и полная утилизация production. Владение observability (Prometheus / Alertmanager / Grafana / Telegraf / Vector и exporters), проектирование осмысленных метрик и алертов, непрерывный поиск bottleneck и доведение их до устранения — инфраструктурные устраняете сами, по коду ставите точную задачу разработчикам; capacity planning. Масштабирование RPS на DSP. Рост throughput на текущем bare-metal, ведение архитектурного решения о дальнейшем масштабировании (гибрид k8s + bare-metal). Эксплуатация и деплой. Развёртывание и конфигурация C++-сервисов в нескольких инстансах, zero-downtime релизы через Ansible playbooks и GitLab CI; бесшовное обновление конфигураций. Базы данных и брокеры. Эксплуатация и поддержка стабильной работы ClickHouse, MySQL, Kafka, Aerospike. Внутренняя инфраструктура. Self-managed GitLab, Docker registry, runners; полноценный staging всей системы; движение к zero-trust и единому управлению доступом; резервное копирование и восстановление. Безопасность. Сетевая сегментация, управление доступом и секретами, TLS. Что мы от тебя ждем? Глубокое понимание DevOps / CI/CD и уверенная работа с Linux на уровне performance и networking (тюнинг под высокий RPS), а не только администрирования; Observability на уровне владения: Prometheus / Alertmanager / Grafana / Telegraf / Vector и exporters — проектирование метрик и алертов; Performance engineering: поиск bottleneck в high-load сервисах (CPU / IO / network / lock contention), способность отличить инфраструктурную проблему от проблемы в коде; Capacity planning и масштабирование высоконагруженных систем; Ansible (основной IaC-инструмент) и GitLab CI; Docker / Docker Compose в production; Nginx как high-load entrypoint: балансировка, rate-limiting, traffic-shaping, TLS / certbot, graceful reload; Операционный опыт работы с базами данных и брокерами: ClickHouse (MergeTree, partitioning / TTL, multi-disk storage policies, Kafka-engine и materialized views, ZooKeeper, диагностика медленных запросов), MySQL, Kafka, Aerospike; Системное мышление об экономике надёжности: обоснованный выбор, какие компоненты должны быть отказоустойчивыми, а где допустим короткий downtime ради экономии. Будет преимуществом: Опыт в AdTech / RTB — огромное преимущество (но также релевантен другой latency-sensitive high-load домен с высоким QPS поверх TCP, например fintech или биржевые системы); Владение AI-инструментами разработки (Cursor, Claude Code и аналоги) — большое преимущество; Kubernetes / Nomad в production и готовность обоснованно вести решение о выборе между горизонтальным масштабированием на bare-metal и миграцией в Kubernetes для гибридной системы; Понимание процесса C++ build / release (сборка Docker-образов, версионирование) — для совместной работы с разработчиками; Zero-trust / SSO (Keycloak), netbird; построение корпоративной сети; Airflow / ML-инфраструктура. Чем эта роль не является Не позиция on-call / поддержки по заявкам — мы ждём автономности и инициативы; Не разработка инфраструктуры с нуля в облаке — это гибридная bare-metal инфраструктура с приоритетом экономической эффективности; Не отказоустойчивость любой ценой — выбор уровня надёжности, оправданного экономически. Soft Skills Умение брать ответственность на себя и самостоятельно принимать решения; Гибкий подход к решению задач и способность быстро обучаться новым инструментам; Навыки планирования и приоритизации, умение эффективно распределять ресурсы; Коммуникабельность: способность взаимодействовать с разработчиками, менеджерами и другими участниками команды. Что мы предлагаем: Конкурентный уровень дохода; Гибкая система оплаты, включая зарплату в USD; Минимум бюрократии, максимум автономии и реального влияния на продукт; Возможность расти: участвовать в архитектурных решениях, выбирать инструменты, предлагать улучшения; Работу с современными технологиями в быстроразвивающейся AdTech индустрии; Удаленный формат работы из любой точки мира (при желании - офис в г. Москва).Похожие вакансии