Обязанности:
Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой B2B решения развлекательной, игровой и спортивной тематики, находится в поисках Site Reliability Engineer (SRE). Чем предстоит заниматься: Улучшать систему и процессы мониторинга, повышать Observability системы; Проектировать, внедрять и поддерживать метрики для мониторинга; Улучшать процессы инцидент-менеджмента; Участвовать в устранении сбоев и расследовании их причин; Поддерживать бесперебойную работу сервисов; Договариваться с коллегами и находить лучшие решения для проекта. Какие навыки нужны: Умеешь в Linux на уровне системного администратора; Уверенно владеете одним из языков программирования: Go, C#, Python, Java и другие; Понимание принципов работы сетей и протоколов взаимодействия; приложений, навыки диагностики проблем с ними; Работали с системами контроля версий Git; Работали с системами мониторинга и алертинга Prometheus и Grafana, агрегаторами логов; Работали с системами контейнеризации и оркестрации Docker и k8s; Высокий уровень самостоятельности. Что компания может предложить: Возможность развивать свои компетенции и применять знания на практике; Возможность поработать на крупных проектах; Компания заинтересована в развитии своих сотрудников: готовы привлекать наставников и оплачивать курсы для повышения квалификации; Отсутствие бюрократии, быстрое согласование необходимых вещей; Оплачиваемые отпускные и больничные; Премия по итогам года до 1-го оклада; Компенсация спортзала; Частичная компенсация английского языка или психолога (на выбор); Компания поддерживает сотрудника в важные периоды жизни; Предоставляем 4 day-off в год за счет компании; ДМС после испытательного срока; Пересмотр заработной платы по результатам работы; Удаленный/офисный/гибридный формат работы.