Обязанности:
WMT Group - аккредитованная IT- компания РФ. Чем придется заниматься: Развертывание и масштабирование в продакшене. - Контейнеризация ML-моделей с использованием Docker и развертывание в Kubernetes кластерах - Настройка и управление оркестрацией ML-пайплайнов через Apache Airflow - Обеспечение масштабируемости и отказоустойчивости ML-сервисов в on-premise средах Мониторинг и оптимизация – Подключение сервисов к системам мониторинга и журналирования - Анализ и устранение инцидентов в работе ML-сервисов на третьей линии поддержки - Оптимизация использования вычислительных ресурсов и автомасштабирование рабочих нагрузок Интеграция и автоматизация - Разработка интеграций между ML-сервисами через REST API и системы обмена сообщениями (Kafka) - Создание автоматизированных пайплайнов для обработки данных, feature engineering и тестирования моделей - Внедрение Infrastructure as Code подходов для управления ML-инфраструктурой Требования и навыки: - Глубокое владение Python (от 3 лет) с пониманием принципов написания production-ready кода - Опыт работы с контейнеризацией (Docker) и оркестрацией (Kubernetes) для развертывания ML-моделей - Уверенное владение Apache Airflow для оркестрации ML-пайплайнов DevOps и инфраструктурные навыки - Понимание построения CI/CD пайплайнов для ML-решений (GitLab CI, GitHub Actions) - Навыки работы с системами мониторинга (Prometheus, Grafana) и централизованного логирования Будет преимуществом - Понимание жизненного цикла ML-проектов и специфики production ML-решений - Опыт работы с системами управления версий данных и feature store - Базовые знания принципов машинного обучения и методов валидации моделей Расширенные технологические навыки - Опыт работы с распределенными вычислениями (Apache Spark, Hadoop) - Знание специализированных ML-фреймворков (MLflow, ZenML) - Опыт работы с векторными базами данных и системами поиска для RAG-приложений Наш Технологический стек - Оркестрация: Apache Airflow - Контейнеризация: Docker, Kubernetes - CI/CD: Сфера CI/CD - Мониторинг: Prometheus, Grafana, ELK Stack БД: Postgres, OpenSearch Данные: S3/MinIO, HDFS Языки и фреймворки - Python (основной) - ML библиотеки: CatBoost, scikit-learn, PyTorch, Keras - REST API разработка (FastAPI) - Apache Kafka -Apache Spark Что мы предлагаем: - Работу с современными технологиями на переднем крае MLOps индустрии - Участие в проектах полного цикла - от исследований до production развертывания - Возможность влиять на архитектурные решения и выбор технологического стека - Глубокое погружение в практики MLOps с опытными коллегами из индустрии - Участие в конференциях и обучающих программах по передовым ML технологиям - Работу с реальными production ML-сервисами - Доступ к современной инфраструктуре и вычислительным ресурсам - Поддержку инициатив по внедрению новых технологий и улучшению процессов Условия: ИТ аккредитованная компания удаленный формат работы; своевременная оплата 2 раза в месяц на банковскую карту; возможность посещения специализированных курсов, тренингов, IT-конференций за счёт компании (полностью или частично); оформление по ТК РФ/ГПХ/СЗ/ИП (на ваш выбор).Похожие вакансии