Обязанности:
Uzum — это новая уникальная компания в Узбекистане, первая технологичная экосистема сервисов в стране. Мы развиваем сразу несколько высокотехнологичных продуктов, чтобы у миллионов жителей страны был доступ к безграничному ассортименту товаров с быстрой доставкой, а также финансовые сервисы, помогающие в решении бытовых задач и развитии бизнеса. Мы строим собственную IT-платформу, развиваем систему логистики, привлекая к сотрудничеству сотни тысяч предпринимателей. Мы ищем опытного Team Lead для команды Observability, который возглавит развитие платформы мониторинга и наблюдаемости в высоконагруженной банковской инфраструктуре. Что предстоит делать Руководить командой инженеров Observability (найм, развитие, мотивация) Определять техническую стратегию развития платформы мониторинга и логирования Проектировать и развивать полный стек observability: метрики, логи, трейсинг, алертинг Обеспечивать высокую доступность мониторинговых систем (VictoriaMetrics, Grafana, OpenSearch) Выстраивать SLO/SLA для критичных банковских сервисов Автоматизировать процессы через Infrastructure as Code (Ansible) Взаимодействовать с командами разработки и эксплуатации для улучшения наблюдаемости приложений Участвовать в incident management и постмортемах Технологический стек Инфраструктура: 1000+ серверов в production Несколько дата-центров Микросервисная архитектура (80+ Java/Go/Python сервисов) Kubernetes, Podman PostgreSQL (Patroni HA), Redis (Sentinel), Kafka, ClickHouse Minio S3 HAProxy, Nginx, Envoy для балансировки Consul, Vault, Keycloak Ansible, Terraform для IaC GitLab CI/CD Метрики: VictoriaMetrics Cluster Grafana и Grafana on-call Exporters: node, postgres, redis, kafka, blackbox, jmx, wal-g etc Логи: OpenSearch cluster Fluent Bit для поставки логов Трейсинг и ошибки: Sentry для error tracking Jaeger для distributed tracing Что ожидаем от кандидата Опыт руководства командой от 2+ лет Глубокие знания мониторинга метрик (Prometheus/VictoriaMetrics) и логов (ELK/OpenSearch) Опыт построения observability в distributed systems Понимание SRE практик (SLI/SLO/SLA, error budgets) Опыт с Infrastructure as Code (Ansible/Terraform) Опыт работы с HA и Multi-DC системами Будет плюсом Опыт в финтехе или банковской сфере Знание ClickHouse для аналитики метрик Опыт с трейсингом (Jaeger, Tempo, OpenTelemetry) Опыт оптимизации производительности БД (PostgreSQL, Redis) Условия: Официальное трудоустройство по ТК Узбекистана Конкурентная заработная плата Дисконт-программы от компаний-партнеров Мы являемся резидентом IT-парка, наши специалисты могут получить IT-визу, которая приравнивается к ВНЖ Отсутствие дресс-кода и бюрократии Культура, способствующая росту и развитию Формат работы — удаленныйПохожие вакансии