Обязанности:
Мы — Goulash.tech, молодая и амбициозная продуктовая IT-компания, резидент «Сколково». Мы автоматизируем рестораны доставки: от мобильного приложения гостя до выгрузки дашбордов для собственника. Наши решения работают в Сушкоф и Жизньмарт, а также в сотнях других сетей по всей России. Миссия - помогать ресторанам расти. Мы ищем технического лидера DevOps, который возьмёт на себя ответственность за развитие инфраструктуры, стабильность платформы и рост команды. Это роль для тех, кому интересно не просто поддерживать готовое, а проектировать, автоматизировать и строить системы с нуля. Что предстоит делать: Формировать техническую стратегию развития инфраструктуры на 6–12 месяцев и доводить её до результата. Если конкретнее: Архитектура и оптимизация Проводить аудит текущей инфраструктуры: находить узкие места, оценивать надёжность, выявлять зоны для улучшения Проектировать и внедрять изменения, которые повышают стабильность и производительность - от небольших оптимизаций до архитектурных решений Развивать Kubernetes-кластеры (Rancher), автоматизацию (Terraform, Ansible) и CI/CD (GitLab CI/CD), делая их более надёжными, прозрачными и удобными для команд разработки Надёжность и мониторинг Строить observability-культуру: внедрять метрики, алертинг, SLO/SLI, дашборды, чтобы любая проблема была видна до того, как станет критической Снижать время реакции на инциденты (MTTR) и делать так, чтобы инциденты не повторялись - через постмортемы, документацию и автоматизацию Лидерство и развитие команды Менторить DevOps-инженеров, проводить код-ревью, задавать технический уровень команды Участвовать в архитектурных решениях вместе с разработкой и продуктом, помогать выстраивать бесшовное взаимодействие между инфраструктурой и разработкой Что для нас важно: - Опыт управления командой DevOps, выстраивания системы, процессов и формирования технической стратегии - Глубокое понимание Kubernetes (Rancher, Helm, операторы, networking, storage) - Опыт работы с Docker, многоэтапными сборками, оптимизацией образов - Продвинутый уровень Terraform (state management, modules, workspaces) и Ansible - Экспертиза в настройке мониторинга и логирования: Prometheus/Grafana/Loki/ELK - Опыт администрирования Linux (Ubuntu/Debian/CentOS): tuning, security, troubleshooting - Знание сетевых технологий: CNI (Cilium/Calium/Flannel), VPN, load balancing - Работа с базами данных: PostgreSQL, MySQL, MongoDB, ClickHouse, Redis (backup, replication, monitoring) - Опыт с message brokers (RabbitMQ) и reverse proxy (Nginx/Traefik/HAProxy) - Уверенное владение Git, scripting (Bash/Python/Go), GitLab CI/CD Будет плюсом: High-load / стартапы GitOps (ArgoCD, Flux) Миграции между провайдерами FinOps и cloud-security Что предлагаем: Влияние на ключевые решения: реальная возможность выстроить инфраструктуру под масштабирование бизнеса, управлять ключевыми архитектурными решениями Команда: 7 самостоятельных и ответственных инженеров (DevOps, SRE) График: гибкое начало рабочего дня Формат: офис/гибрид/удалёнка Конкурентная зарплата: обсуждаем оффер индивидуально, пересматриваем ежегодно или чаще по результатам работы Открытая культура: минимум бюрократии, максимум фокуса на результате и развитии, корпоративные мероприятия Базовый минимум: все согласно ТК РФ и обеспечение необходимым для работы Если всё это про тебя и хочется строить, оптимизировать и влиять на инфраструктуру - будем рады отклику!Похожие вакансии