Обязанности:
Мы ищем опытного MLOps инженера в команду внедрения ML-решений. Эта позиция предназначена для специалистов, готовых работать с современным технологическим стеком и обеспечивать жизненный цикл ML-решений на этапе вывода в продакшен. Чем придется заниматься: **Развертывание и масштабирование в продакшене** - Контейнеризация ML-моделей с использованием Docker и развертывание в Kubernetes кластерах - Настройка и управление оркестрацией ML-пайплайнов через Apache Airflow - Обеспечение масштабируемости и отказоустойчивости ML-сервисов в on-premise средах **Мониторинг и оптимизация** – Подключение сервисов к системам мониторинга и журналирования - Анализ и устранение инцидентов в работе ML-сервисов на третьей линии поддержки - Оптимизация использования вычислительных ресурсов и автомасштабирование рабочих нагрузок **Интеграция и автоматизация** - Разработка интеграций между ML-сервисами через REST API и системы обмена сообщениями (Kafka) - Создание автоматизированных пайплайнов для обработки данных, feature engineering и тестирования моделей - Внедрение Infrastructure as Code подходов для управления ML-инфраструктурой Требования и навыки: **Технические компетенции** - Глубокое владение Python (от 3 лет) с пониманием принципов написания production-ready кода - Опыт работы с контейнеризацией (Docker) и оркестрацией (Kubernetes) для развертывания ML-моделей - Уверенное владение Apache Airflow для оркестрации ML-пайплайнов **DevOps и инфраструктурные навыки** - Понимание построения CI/CD пайплайнов для ML-решений (GitLab CI, GitHub Actions) - Навыки работы с системами мониторинга (Prometheus, Grafana) и централизованного логирования Будет преимуществом **ML и данные** - Понимание жизненного цикла ML-проектов и специфики production ML-решений - Опыт работы с системами управления версий данных и feature store - Базовые знания принципов машинного обучения и методов валидации моделей **Расширенные технологические навыки** - Опыт работы с распределенными вычислениями (Apache Spark, Hadoop) - Знание специализированных ML-фреймворков (MLflow, ZenML) - Опыт работы с векторными базами данных и системами поиска для RAG-приложений Наш Технологический стек - Оркестрация: Apache Airflow - Контейнеризация: Docker, Kubernetes - CI/CD: Сфера CI/CD - Мониторинг: Prometheus, Grafana, ELK Stack БД: Postgres, OpenSearch Данные: S3/MinIO, HDFS **Языки и фреймворки** - Python (основной) - ML библиотеки: CatBoost, scikit-learn, PyTorch, Keras - REST API разработка (FastAPI) - Apache Kafka -Apache Spark Что мы предлагаем: - Работу с современными технологиями на переднем крае MLOps индустрии - Участие в проектах полного цикла - от исследований до production развертывания - Возможность влиять на архитектурные решения и выбор технологического стека - Глубокое погружение в практики MLOps с опытными коллегами из индустрии - Участие в конференциях и обучающих программах по передовым ML технологиям - Работу с реальными production ML-сервисами - Доступ к современной инфраструктуре и вычислительным ресурсам - Поддержку инициатив по внедрению новых технологий и улучшению процессовПохожие вакансии