Обязанности:
Чем предстоит заниматься: Управление ML-инфраструктурой: Администрировать и развивать системы оркестрации экспериментов и обучения моделей; Поддерживать и развивать сервисы для управления ML-workflow; Работать с системами версионирования данных и моделей; Мониторить и поддерживать системы инференса моделей. DevOps и автоматизация: Развёртывать и поддерживать ML-сервисы в контейнеризованной среде; Настраивать CI/CD-процессы для ML-проектов; Мониторить инфраструктуру и производительность ML-систем; Автоматизировать развёртывание и управление ML-пайплайнами. Разработка и стандартизация: Участвовать в разработке внутренних инструментов для упрощения MLOps-процессов; Создавать документацию и регламенты для работы с ML-артефактами; Поддерживать распределённое обучение моделей. Что мы ждём от кандидата: Опыт работы с MLOps-инструментами (ClearML, MLflow, Kubeflow или аналогами) от 1 года; Уверенное владение Python для разработки сервисов и автоматизации; Опыт работы с контейнеризацией и оркестрацией (Docker, Kubernetes); Опыт работы с GPU инфраструктурой в Kubernetes; Понимание CI/CD-процессов и опыт их настройки; Базовое понимание машинного обучения и жизненного цикла ML-моделей; Опыт разработки веб-сервисов и API; Знание Linux и навыки системного администрирования. Будет плюсом: Опыт работы с системами версионирования данных (например, DVC); Понимание принципов работы современных ML-моделей; Опыт настройки систем мониторинга (например, Prometheus, Grafana); Опыт работы с фреймворками глубокого обучения (PyTorch, TensorFlow).Похожие вакансии