Обязанности:
«Комус» - это крупный разноплановый бизнес, который требует высокого уровня автоматизации, что влечет за собой наличие большого парка технологических решений. IT ландшафт включает в себя порядка 40 крупных бизнес приложений, но в целом их порядка 100, собственный ЦОД на 2000 юнитов (+мощности в облаках). Мы занимаемся разработкой и частично эксплуатацией систем. ИТ ландшафт достаточно широкий от e-com решений на Java и крупных коробочных решений ( внедрены продукты SAP), до 1С и прочих систем для автоматизации бизнес-процессов внутри компании, активно развиваются проекты на микросервисах.Приглашаем присоединиться к команде в роли Технического лидера группы по доступности информационных систем Чем придется заниматься: управлять командой SRE инженеров (сейчас 4 инженера); участвовать в развитии сервисов и систем; контролировать доступность сервисов и влиять на их архитектуру и надежность; участвовать в разборах инцидентов; помогать команде инцидент менеджеров оформлять технические аспекты аварий в postmortem'ах, которые будут вытекать в реальные задачи для тебя и команды; активно взаимодействовать со смежными командами (Разработка/DevOps/Инфраструктура/QA/Аналитики) для лучшего погружения всех команд в продукт и методологию SRE. иметь готовность к эпизодическим (сезонным) дежурствам и навыки инцидент менеджмента для решения сложных проблем. выступать техническим лидером команды SRE, уметь принимать сложные решения и уметь их аргументировать. Технические навыки и используемые инструменты: Опыт администрирование ОС на базе ядра Linux (желательно RHEL/CentOS/Debian) 5+ лет. Понимание принципов наблюдаемости (observability) и мониторинга систем. (Elasticsearch, Prometheus, Zabbix). Понимание терминов SLI/SLO/SLA и их применимости на практике. Понимания пользы от автоматизации своих задач (bash/Python/Ansible/Terraform) и документирования своих решений, так как работать придется в команде. Уметь работать с одной из систем контроля версий, мы используем Git. Опыт написания и оптимизации запросов к БД, например MySQL/PostgreSQL. Будет плюсом: Опыт управления командами от 2х человек. Навыки создания информативных и понятных дашбордов здоровья (SLI/SLO) в Grafana используя несколько источников данных. Опыт работы с APM решениями такими как (Dynatrace/NewRelic/PinPoint/AppDynamics/Instana) для быстрой диагностики проблем. Опыт построения эффективного алёртинга при работе с сложносоставными триггерами. Опыт работы с контейнерами на базе Docker/Podman/Cri-o и/или оркестраторами K8s/OpenShift. Умение программировать и разбираться в чужом коде на одном из языков (Python/Go/Java). Опыт настройки, администрирования и работы с одним или несколькими инструментами, среди которых ClickHouse/Zookeeper/Kafka/RabbitMQ будет плюсом. Мы предлагаем: Официальное оформление по ТК РФ в аккредитованную ИТ-компанию, бессрочный трудовой договор Белая заработная плата (фикс оклад) - размер обсуждается в зависимости от стартовой квалификации и пожеланий кандидата; Гибридный формат работы (офисы в Москве и Санкт-Петербурге) Также рассмотрим кандидатов из других регионов для работы в удаленном формате, готовых раз в квартал приезжать в командировки для встречи с командой (Москва/СПБ) График работы: 5/2, 09.00- 18.00 ДМС после испытательного срока; Приобретение товаров компании со скидками; Посещение фитнес-клуба и туристические поездки на льготных условиях; Льготное корпоративное кредитование сотрудников; Программы для детей Бесплатный настольный теннис, футбол, волейбол, обучение танцам; Подарки к праздникам для сотрудников и их детей (новогодние наборы, набор первоклассника и т.д.)Похожие вакансии