Обязанности:
Твои задачи на этой позиции: обеспечение стабильности, отказоустойчивости и производительности систем; разработка и поддержка инструментов для автоматизации процессов (развертывание, мониторинг, резервное копирование и т.д.); оптимизация инфраструктуры для повышения эффективности и экономии ресурсов; мониторинг состояния системы, выявление проблем и их устранение; коммуникации с разработчиками для улучшения процессов развертывания и обслуживания ПО; планирование и проведение масштабирования инфраструктуры в соответствии с потребностями бизнеса; участие в разработке стратегии обеспечения безопасности системы; документирование процессов и решений для последующего использования коллегами. Пожелания к твоему опыту: опыт в области системного администрирования и/или разработки программного обеспечения; знания операционных систем (Linux, Unix) и сетевых технологий; знание инструментов мониторинга и логирования (например, Prometheus, Grafana, ELK Stack, Graylog); навыки автоматизации задач с использованием скриптов (например, Bash, Python); знание инструментов автоматизации Ansible, Terraform, Gitlab-ci; понимание DevOps-практик и инструментов CI/CD (helm); знания Kubernetes. Будет плюсом: базовые знания баз данных Postgre, Mongo, Clickhouse; навыки thouble-shoting (strace, atop, sentry, APM); знание систем передачи сообщений RabbitMQ, Kafka; знания Redis и Memcache; глубокие знания Kubernetes и его компонентов (CNI, CSI); знание операторов Kubernetes; опыт работы с облачными платформами (например, AWS, Google Cloud, Azure, Yandex и др.); опыт работы с ArgoCD, werf; опыт работы с Victoria Metrics; базовые знания go, php, python, nodejs; опыт работы с GlusterFS и Minio (S3).