Обязанности:
Чем предстоит заниматься Обеспечивать бесперебойную работу аналитических сервисов, оценивать, планировать и координировать работу по устранению сбоев Идентифицировать, документировать и анализировать сбои в работе сервисов, контролировать устранение сбоев смежными подразделениями Коммуницировать с заказчиками сервисов на предмет сроков восстановления систем и решения проблем заказчика с сервисом Обеспечивать своевременное информирование пользователей о плановых и внеплановых работах, затрагивающих аналитические сервисы Обеспечивать восстановление интеграционных потоков от систем-источников Своевременно реагировать на мониторинги и предпринимать меры по устранению причин срабатывания мониторингов Обеспечивать конфигурирование и постановку новых моделей в продуктив Принимать участие в формировании бэклога задач, исходя из текущего и прогнозируемого уровня нагрузки сервисов и потребностей команды Что для этого нужно Знание Unix-подобных OS Понимание CNI, k8s, опыт диагностики проблем сетевого стека Опыт работы с системами мониторинга, желательно prometheus Опыт работы с базами данных (Oracle/MySQL/PostgreSQL/MariaDB/MSSQL/Hive и т п) Уверенные знания shell/bash, Python и/или других скриптовых языков