Обязанности:
О компании и продукте: Лидер российского рынка DevOps и Kubernetes (на рынке с 2008 года). Разрабатывает экосистему продуктов для Cloud Native-разработки, включая ведущую K8s-платформу. Продукты закрывают полный спектр инфраструктурных задач: управление контейнерными нагрузками, доставку приложений, виртуализацию, наблюдаемость, хранение секретов, управление версиями, логами. Команда ML/AI Развивает ML/AI-направление в платформе, разрабатывает компоненты для полного жизненного цикла работы с искусственным интеллектом. Инфраструктурный слой: единое управление GPU (обнаружение, выдача ресурсов, нарезка, профилирование для максимизации утилизации, наблюдаемость, установка и обновление компонентов видеокарт на узлах). Инференс-слой: превращает набор рантаймов (vLLM, Ollama и др.) и оркестраторов в продуктовый опыт — пользователь выбирает модель и «движок», платформа поднимает inference-сервис. Дальнейшее развитие: RAG/агенты, guardrails, мониторинг качества и безопасности, ML-пайплайны (Airflow, JupyterHub, MLflow, Train) и UI. Чем предстоит заниматься: - Писать production-grade компоненты с фокусом на стабильность, наблюдаемость, совместимость и эксплуатацию - Проектировать и реализовывать Kubernetes-операторы / контроллеры и модули платформы - Работать с архитектурой: принимать и обосновывать решения, декомпозировать сложные задачи - Писать тесты (unit / integration / e2e), развивать CI, обеспечивать воспроизводимость релизов - Документировать и улучшать UX платформы для инженеров эксплуатации и пользователей - Спроектировать и реализовать CRD/API и контроллеры (операторы) для модуля GPU и компонентов inference-платформы - Интегрировать рантаймы и оркестраторы инференса в модель self-service (декларативное описание ресурса → работающий сервис) - Реализовать best practices platform engineering (идемпотентные reconciliation loops, корректная обработка ошибок, обратная совместимость, версии схем, миграции) - Совместно с DevOps/SRE-инженерами превращать прототипы и R&D-обвязки в промышленный продукт Требования: - Уверенное знание Go (проектирование, concurrency, интерфейсы, тестирование, качество кода) - Опыт разработки под Linux или Unix (от 2 лет) - Практический опыт работы с Kubernetes (понимание принципов, написание манифестов) - Опыт разработки под Kubernetes с использованием client-go / controller-runtime (kubebuilder), CRD, RBAC, webhooks — либо эквивалентный опыт расширения K8s API - Понимание жизненного цикла Kubernetes-объектов, принципов scheduling / quotas / limits и работы с ресурсами - Опыт создания production-grade компонентов - Умение принимать и обосновывать технические решения, декомпозировать сложные задачи - Знание классических алгоритмов и структур данных Будет плюсом: - GPU-стек (NVIDIA device plugin / DCGM / MIG и др.), опыт оптимизации утилизации GPU - Опыт с KServe / KubeRay / llm-d и inference-рантаймами (vLLM / Ollama / SGLang / Triton) - Опыт с Envoy / API gateway / service mesh, gRPC - Опыт работы в продуктовой команде Условия работы: - Работа в IT-компании, аккредитованной Минцифры - Полностью «белая» заработная плата и регулярная индексация по итогам performance reviews - ДМС со стоматологией, страховкой от несчастных случаев и чек-апом - Индивидуальные уроки иностранных языков (английский, немецкий, французский, итальянский, испанский) - Компенсация 50% стоимости сессий психотерапии - Бесплатные курсы на внутренней академии - Полностью удалённая работа в пределах РФ (нужен только доступ в интернет) - Современное оборудование от компании - Органическое неприятие бюрократии - Понятные цели и перспективыПохожие вакансии