Обязанности:
Мы в поисках Ведущего инженера в команду Платформы Hybrid cloud. Hybrid cloud – новый продукт, частное облако от компании cloud.ru. На этой позиции тебе предстоит: Отвечать за доступность IaaS-платформы и развернутых на ней приложений, оперативно устранять инфраструктурные инциденты; Организовать качественный мониторинг и алертинг инфраструктуры и приложений; Быть активным участником процессов инцидент и проблем менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера и выполнения действий, запланированных в рамках постмортема), выполнять работы по запросам пользователей; Планировать и выполнять работы по запросам на изменение, а также регламентных работ направленных на предотвращение угроз деградации/прерывания сервисов; Осуществлять контроль доступных мощностей, подготавливать предложения по увеличению мощностей; Участвовать в проектах, внедрять, согласовывать и актуализировать эксплуатационную документацию; Подготавливать технические требования в случаях необходимости модернизации инфраструктуры; Проводить DR тесты согласно DRP, согласовывать изменения Продукта (изменение архитектуры, дизайна, масштабирование), оценивать риски и целесообразность изменений. Что мы ждем от кандидата: Знания принципов построения высокомасштабируемых и высокодоступных сетей bgp, evpn, стека TCP/IP (ethernet, ip, tcp); Глубокими знаниями linux (тюнинг перфоманс, инструменты работы с сетью/дисками); Глубокие познания по сбору метрик/логов; Опыт построения/работы с высоконагруженными системами мониторинга, системами сборки логов; Опыт выявления узких мест Продукта по метрикам; Опыт агрегации данных и передачу их в Команду разработки; Опыт работы с инструментами IaC: Terraform, Ansible. Будет плюсом: Опыт администрирования СХД/SDS; Знаниями в архитектуре OpenStack и имеете успешный опыт деплоя и эксплуатации платформы; Желание развивать свои профессиональные умения и накапливать опыт; Владеете какими-либо языками программирования (Python, Golang или др.).