Обязанности:
OneCloud — внутреннее облако VK, в котором мы запускаем сервисы, базы данных и серверы очередей.Основанное на открытых решениях, облако обеспечивает высокую доступность сервисов и ускоряет запуск проектов.Сейчас мы в команде эксплуатации решаем задачи, связанные с укрупнением облака — автоматизируем рутину и предотвращаем инциденты.Ищем специалиста, который поможет нам поддерживать бесперебойную работу сервиса и внедрять новые решения для задач бизнеса. Задачи: эксплуатировать парк серверов облака — более 10 000 хостов; постоянно обновлять парк серверов — мы стараемся эффективнее использовать каждый юнит в дата-центрах; управлять инцидентами — в связке с командами мониторинга и разработки устранять сбои и предотвращать их повторение; автоматизировать процессы эксплуатации и оркестрации — при наших объёмах задачи решаются через код; участвовать в разработке и внедрении новой функциональности облака. Требования: Middle: вы не менее трёх лет работали с парком bare-metal серверов (обязательно) и с серверной инфраструктурой на базе Linux; понимаете принципы работы с сетью — iptables, BGP, VRRP; использовали SCM — Puppet, Salt, Ansible; автоматизировали рутину с помощью скриптов на bash и Python. Senior: вы управляли большим парком bare-metal серверов; умеете решать задачи на Python и используете PyPi; знаете, как эксплуатировать и проектировать высокодоступные кластеры; готовы обсуждать и ставить ТЗ команде разработки; знакомы с эксплуатацией сервисов на Java и не боитесь in-house решений. Будет плюсом: вы работали с системами на базе RHEL; работали с веб-хостингом — nginx, MySQL, Postgress; использовали CFEngine, Cassandra, Zabbix и Vault; знаете Go и Java.