Обязанности:
О проекте Мы разрабатываем рекомендательную платформу, которая предоставляет пользователям персонализированный и релевантный контент на всем клиентском пути. Наша рекомендательная платформа строит персональные рекомендации во всех сферах бизнеса, таких как музыка, фильмы, онлайн торговля, медицина, логистика и многих других Базис создания такой системы – это непрерывная интеграция (CI) и непрерывная доставка (CD) модулей системы в облако, где система работает Построение CI/CD и разворачивание системы на кластере – это важнейшие шаги, без которых весь труд остальных инженеров не имеет смысла. Что предстоит делать: Базис создания такой системы – это отказоустойчивая и производительная инфраструктура в облаке, где эта система работает Проектирование, разработка и непрерывное развитие инфраструктуры – обязательные условия функционирования системы для миллионов её пользователей Ты будешь работать над созданием компонентов этой инфраструктуры, над их наблюдаемостью, над обеспечением доступности, автоматическим масштабированием и обеспечением работы под нагрузкой в десятки тысяч обращений в секунду Мы ищем экспертов и энтузиастов в области Site Reliability Engineering, кто ставит своей основной целью работать и развиваться в области построения сложных высоконагруженных систем У тебя будет возможность исследовать современные подходы и практики SRE, общаться с коллегами из других проектов, участвовать в конференциях и применять полученные знания на практике. Что для нас важно: уверенная техническая экспертиза в одном или нескольких направлениях (Kubernetes, сети, разработка ПО, Infrastructure as Code, системное администрирование Linux) навыки работы с системами мониторинга и логирования (Prometheus, Loki, Grafana) готовность к дежурствам по алертам мониторинга опыт работы с любой системой автоматизированного управления инфраструктурами Ansible/Terraform уверенная работа с Git опыт администрирования Linux (Ubuntu). Будет плюсом: опыт работы с базами данных SQL и NoSQL понимание основных принципов работы с ML и инструментов (AirFlow, Seldon, ML Flow, Apache Spark) навыки разработки на Golang/Python знание работы сетей и сетевых протоколов (TCP/IP, HTTP(S), VPN) уверенное владение инструментами Atlassian Jira и Confluence для ведения задач и документации опыт промышленной эксплуатации высоконагруженных сложных ИТ-сервисов. Мы предлагаем: возможность выбрать удобный формат работы: гибрид или офис комфортный офис: г. Нижний Новгород, ул. Бекетова 13В ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.Site Reliability Engineer (DevOps) (middle+/senior) в продуктовой ИТ компании
От 260 000 руб.
Нижний Новгород
iSpring