Обязанности:
Чем предстоит заниматься: Взаимодействовать с вендорами и разработчиками внедряемого ПО; Сборка тестовых стендов, сборка и ввод в эксплуатацию продуктивной среды совместно с командой проекта и подрядчиком; Установка релизов на тестовые стенды и продуктив, автоматизация установки релизных сборок; Установка обновлений ОС, устранение уязвимостей информационной безопасности; Анализ производительности работы ИС в зоне ответственности команды; Внедрение, сопровождение и развитие мониторинга ИС, алёртинга на базе корпоративных Zabbix / Prometheus / Grafana / GMonit; Обеспечение доступности платформы цифрового рубля в соответствии с требованиями SLA; Устранение сбоев в работоспособности ИС; Реагирование на отклонение работы системы от ожидаемого; Ведение и актуализация технической документации команды; Что мы ожидаем от кандидата: Опыт работы с высоконагруженными системами и распределенными архитектурами (например, в банковской сфере, fintech, или финансовых платформах); Понимание принципов обеспечения высокой доступности (HA), Disaster Recovery (DR) и работы в рамках SLA/SLO; Опыт внедрения CI/CD-пайплайнов, автоматизации деплоя; Знание Linux (группы и права доступа, сервисы systemd, анализ производительности); Опыт работы с Docker, Kubernetes (администрирование кластеров, сетевые политики, CSI), Helm (управление релизами), Ansible и Terraform (автоматизация развертывания и управление инфраструктурой) Опыт работы с Prometheus, Grafana, ELK (Elasticsearch, Logstash, Kibana), Jaeger (для трассировки); Опыт настройки alerting и анализа метрик; Опыт работы с инструментами безопасности (SonarQube, Vault); Знание одного из скриптовых языков (Python, Bash, Go); Опыт работы с системами управления версиями (Git, GitLab, GitHub, Bitbucket); Знание основ построения сетей передачи и хранения данных;Похожие вакансии