Обязанности:
Наша распределенная команда Dev насчитывает более 800 специалистов и разрабатывает собственные продукты с 2012 года – рекламные платформы, игры, мобильные развлекательные приложения и финтех-продукты. У нас проектно-ориентированный подход, матричная структура с привязкой специалистов к одному проекту, но при этом мы работаем командой. В работе мы применяем SCRUM, Agile. Чем предстоит заниматься: Вместе с командой работать над повышением стабильности и отказоустойчивости инфраструктуры при этом везде, где это уместно использовать подход IaC (Infrastructure as Code). Разрабатывать и улучшать процессы автоматизации сборки, тестирования и развертывания приложений в различных контурах. Реализовывать эффективные решения мониторинга и оповещения для своевременного выявления и устранения возникающих сбоев. Реагировать на инциденты и анализировать причины сбоев для выявления (и последующего устранения) причин инцидентов с системами и/или узкими местами в производительности сервисов. Участвовать в архитектурном планировании (с возможность реально влиять на технологический стек) используемый в компании. Дежурить в режиме on-call для оперативного решения инцидентов. Создание и поддержка инфраструктурной документации в актуальном состоянии. Мы ждем от вас: Умение работать с Linux (у нас Debian/Ubuntu) на уровне эксперта. Опыт работы с другими ОС приветствуется. Понимание, как работает сеть на базовом уровне (стек TCP/IP, модель OSI, VLAN, VRRP). Умение работать с iptables/nftables, умение писать правила самостоятельно, понимать и анализировать существующие. Умение диагностировать сетевые проблемы. Искать проблемы в маршрутах и анализировать вывод tcpdump. Уверенный опыт работы с Nginx/Apache, HAProxy и с другими CNCF решениями. Опыт работы с системами логирования и трейсинга. Опыт развертывания инфраструктуры с помощью Terraform (AWS и другие облачные провайдеры). Умение писать Ansible роли (плейбуки) и умение читать чужой код и рефакторить его. Опыт настройки мониторинга (у нас Prometheus, VictoriaMetrics, Alertmanager, Grafana, Zabbix). Понимание, как работает DNS. Какие записи существуют, какие записи для чего предназначены. Понимание принципов функционирования веб-приложений - архитектура взаимодействия сервисов между собой. Понимание основных принципов построения отказоустойчивых систем. Умение анализировать нагрузку на систему (умение пользоваться top, iotop, iostat и интерпретировать увиденное). Умение диагностировать проблемы в работе ОС, процессов и железа (нехватка ресурсов, проблемы с оборудованием и т.д.). Умение работать с RAID-массивами (софт, например LVM, а так же аппаратные). Будет плюсом: Желание быстро разобраться в текущей инфраструктуре и брать на себя ответственность! Опыт самостоятельного поиска и устранения проблем и передачи своих знаний в команде. Опыт работы с K8S-кластерами, знание основных компонентов, диагностики, опыт написания Helm чартов и их поддержки. Опыт построения и поддержки процессов CI/CD (у нас Gitlab CI, ArgoCD). Опыт поддержки больших проектов в Production окружении. Опыт работы с БД (PostgreSQL, MySQL и другими реляционными СУБД). Опыт работы с кэшами Redis, ValKey, DragonFly. Опыт работы с системами обмена сообщениями Kafka/RabbitMQ. Опыт работы с SaltStack. Знание Python. Как мы работаем и что предлагаем: У нас удалёнка, но есть офис в Москве для желающих поработать в формате коворкинга или с закрепленным рабочим местом Оформление в штат компании Гибкий график - лояльное начало дня, 8 часов рабочий день Возможность выбрать привычное оборудование (mac, linux, windows, мониторы и пр.) с доставкой на дом Performance review, на котором мы поможем тебе выстроить цели Непрерывное обучение: у нас есть внутренняя Академия, а также много партнёрских программ, которые поделятся знаниям не только в профессиональной сфере, но и поддержат твои хобби Митапы, конференции, хакатоны, квесты, онлайн-игры – лишь небольшая часть наших активностей, в которых ты сможешь участвовать Разнообразные корпоративные программы: ДМС+ со стоматологией, фитнес-клуб, английский, мастер-классы, развлечения и отдых, льготная система по отпускам и больничным Классный офис на Тульской с видом на Москву-реку и летней верандойПохожие вакансии