Обязанности:
Привет! Мы команда Timeweb Cloud — развиваем облачную платформу и делаем управляемые базы данных (DBaaS) «под ключ». Наша система оркестрации разворачивает single-node и кластеры, автоматизирует типовые операции и полностью берет на себя эксплуатацию баз клиентов. Сейчас мы ищем инженера, который глубоко понимает внутреннее устройство СУБД. Наш абсолютный приоритет — PostgreSQL, на втором месте — MySQL, остальные движки — по необходимости. Нам нужен человек, который готов не только чинить инциденты, но и развивать сам продукт, улучшать автоматику и выступать внутренним экспертом для разработчиков и инженеров эксплуатации. Чем предстоит заниматься: Эксплуатация managed БД в проде: глубокий траблшутинг, разбор инцидентов, деградаций производительности и нестабильностей в тысячах клиентских баз. Отказоустойчивость и кластеризация: диагностика проблем с репликацией и фейловером, участие в улучшении механизмов High Availability. Бэкапы и восстановление: отладка и эволюция процедур backup / point-in-time recovery для поддерживаемых в продукте СУБД. Наблюдаемость (Observability): развитие метрик, дашбордов и эксплуатационных лимитов, чтобы мы узнавали о проблеме раньше клиента. Продуктовые решения: оценка запросов от пользователей и имплементация их в архитектуру (что добавляем в продукт, как настраиваем «по умолчанию», какие ставим лимиты для безопасности). Менторство и обмен знаниями: объяснять команде внутренние механики работы баз данных, разбирать причинно-следственные связи инцидентов и помогать ребятам растить экспертизу. Что мы ждем от тебя: Опыт реальной production-эксплуатации баз данных именно в виде кластеров (HA, репликация, фейловер, понимание компромиссов между доступностью и консистентностью). Сильная база по PostgreSQL: понимание архитектуры памяти, блокировок, vacuum/bloat, WAL, планировщика запросов и индексов. Администрирование MySQL (включая кластерные сценарии, InnoDB и базовую диагностику восстановления). Продуктовое мышление: готовность брать ответственность за решение — не просто «починить руками», а переложить этот опыт в код, улучшив автоматизацию, дефолтные параметры кластера или систему алертов. Навыки коммуникации: умение переводить сложные концепции работы БД на понятный язык инженеров. Наш стек и технический контекст сервиса: Оркестрация DBaaS построена вокруг нашего API и асинхронных задач в RabbitMQ. Раскатка, конфигурация и автоматизация рутины осуществляются через SaltStack (включая orchestration/reactor), базовая инициализация ВМ — через cloud-init. Для кластеров PostgreSQL мы используем Patroni + etcd (leader/replica), для MySQL — Percona XtraDB Cluster (multi-master). Наблюдаемость строится на экспортерах (postgres_exporter, mysqld_exporter, node_exporter) и централизованном сборе метрик через связку VictoriaMetrics / VictoriaAlerts. Что мы предлагаем: Официальное оформление в аккредитованной IT компании со всеми вытекающими преимуществами; ДМС; Компенсация спорта; Компенсация психологических консультаций; 8 дополнительных day-off в год - по 2 каждый квартал; Удаленный формат работы или работа в офисе у м. Московские ворота (г. Санкт-Петербург) с возможностью гибрида - на ваш выбор. Дополнительно для тех, кто с нами в Петербургском офисе: Приемы офисного врача; Компенсация питания по “НаЛанч”; Библиотека в офисе, возможность обучаться у коллег из других отделов и направлений. Офисная кухня с кофе, чаем, фруктами и снэками в неограниченном количестве. Для быстрой коммуникации укажите ссылку на ваше портфолио и @ своего Telegram в сопроводительном, спасибо! :)Похожие вакансии