Мы ищем сотрудника в команду, отвечающую за эксплуатацию приложений, работающих под высокой нагрузкой. Мы используем передовые технологии, а также, создаем их сами. Наши основные задачи: Обеспечивать непрерывную работу всех наших сервисов, как внутренних, так и внешних; Строить систему мониторинга и осуществлять её поддержку; Гарантировать работоспособность и производительность; Capacity planning – планировать ресурсы и мощности. Обязанности: Эксплуатация и обеспечение бесперебойной работы высоконагруженных сервисов в режиме 24/7 от уровня hardware до бизнес-логики; Работа с инцидентами (от внутренних пользователей и системы мониторинга) - диагностика, решение, маршрутизация, проработка плана по исключению повторений инцидентов; Работа с заявками на обслуживание (от внутренних пользователей) - управление настройками систем, предоставление доступов к ИС, управление серверными ресурсами и т.п.; Формирование базы знаний и инструкций для технической поддержки уровнем ниже Организация мониторинга ИС (метрики, условия оповещений, инструкции) Дежурства в нерабочее время (удалённые, отдельно оплачиваемые, подключение по звонку), сопровождение плановых работ (удалённое, отдельно оплачиваемое) Автоматизация всех рутинных/повторяющихся задач. Проработка и постановка задач на разработку функционала в рамках эксплуатации. Требования: Понимание принципов функционирования и архитектуры аппаратных и программных средств вычислительных техники и сетей; Опыт локализации инцидентов в больших и сложных системах; Знания основ управления ИТ-услугами; Опыт работы с системами мониторинга и понимание принципов работы; Знания метрик и средств мониторинга производительности программно-аппаратных средств вычислительной техники; Понимание принципов работы back-end и front-end веб-приложений; Знание паттернов архитектур приложений; Базовые навыки работы с HTML, CSS, Javascript, Chrome Dev Tools, XML; Понимание принципов работы SOAP веб-сервисов и REST API; Базовое знание SQL, опыт работы с СУБД MySQL, MS SQL, Oracle SQL или PostgreSQL. Будет плюсом: Опыт технической поддержки (от второй линии); Опыт работы в Atlassian JIRA и Confluence; Опыт работы с Linux, Kubernetes, Nginx, Kibana (ELK), Grafana, Zabbix, Prometheus; Опыт разработки скриптов/программ (Bash, Java, PHP, Python и т.п.); Опыт работы с системами информационной безопасности (WAF/AnitDDoS/Antibot); Понимание принципов работы сети передачи данных.