Обязанности:
Отдел эксплуатации VK — техническое сердце компании. Наши SRE отвечают за постоянное развитие окружения и непрерывную доступность продуктов для пользователей.
Мы управляем системами из более 100 000 серверов в 10 дата-центрах. Создаём и поддерживаем полный цикл доставки продуктов, начиная от установки ОС и заканчивая CI для запуска приложений в контейнерах. Используем в своей работе не только глубокое понимание архитектуры серверного ПО, но и поддерживаем опыт разработки собственных сервисов.
Задачи:
Наша главная задача — обеспечение максимальной доступности продуктов, поэтому вам предстоит:
развивать и масштабировать продуктовую инфраструктуру — наша инфраструктура состоит из множества сервисов в геораспределённых дата-центрах, мы также планируем наши вычислительные ресурсы и прогнозируем их утилизацию;
автоматизировать работу — наши команды SRE занимаются полным циклом сопровождения продуктовой среды, от удалённой установки ОС до описания деплойментов (Helm-чартов, Kubernetes-операторов, манифестов Puppet, Playbook Ansible);