Обязанности:
О компании «Маркетспейс» — ведущий e-commerce дистрибьютор, который работает с Wildberries, Ozon и Яндекс Маркет. Мы управляем огромными товарными потоками, имеем собственный фулфилмент-центр с площадью складов 35 000 м² и обрабатываем более 40 000 заказов в день. Наш бизнес активно растет, поэтому мы ищем Системный инженер (SRE)/Инженер по надежности инфраструктуры.Кого ищем Совмещаем роли SRE + классического системного инженера. Главное — стабильность, инженерный подход к эксплуатации и доступность сервисов.Зоной ответственности будет: SLA/SLO, инциденты, автоматизация, наблюдаемость, снижение TCO, отказоустойчивость, автоматизация, устранение узких мест. Вам предстоит, на первом этапе, задокументировать то что есть в компании вместе с текущей командой, затем спроектировать и реализовать серию тех.решений, которые позволят снизить риски потери данных и прерывания бизнеса. Следующий этап, принять активное участие в создании единой внутренней платформы, которая объединит усилия множества небольших команд разработки. Функциональные обязанности Обеспечение надежности, доступности и производительности сервисов. Управление инфраструктурой через код (IaC) и автоматизация развертывания. Построение и развитие наблюдаемости: логирование, метрики, трассировки. Управление инцидентами: реагирование, постмортемы (акты расследования), устранение первопричин. Оптимизация инфраструктурных затрат (TCO) и ресурсов. Разработка и поддержка единого платформенного сервиса компании (ci/cd, kubernetes, сервис‑мэш, обмены, внутренние api). Обеспечение отказоустойчивости и масштабируемости систем. Внедрение и контроль SLA/SLO/SLI. Совместная работа с разработкой и командами бизнеса для повышения качества релизов. Требования Высшее техническое образование. Понимание и умение работать с инфраструктурой как с кодом: ansible, terraform, helm (можно kustomize), gitops‑подход. Опыт оркестрации и работы с контейнерами: Docker+Kubernetes. Практический опыт и понимание, как наладить наблюдаемость и логирование: Prometheus+Grafana. CI/CD - jenkins или gitlab. Развитие сетей: mikrotik (или другой опыт работы с VPN, сетевыми экранами, маршрутизаторами). Опыт (базовый) - по работе с СУБД, очередями: PostgreSQL, Redis, RabbitMQ или Kafka (это будет плюсом). Значительный плюс - практический опыт перехода с MS SQL на PostgreSQL. Инструменты: python + bash — для автоматизации и утилит. Условия Удаленная работа, иногда могут быть командировки в г. Смоленск.Похожие вакансии