Обязанности: Формирование долгосрочной стратегии платформы (Hardware, LLM/ML-платформа, стандарты, SLO/SLA, Cloud). Локальная инфра 8× NVIDIA H200 и Yandex Cloud; Строить с нуля MLOps-платформу, ML-конвейеры, DWH, Data pipelines; Кастомизация и развертывание LLM-моделей на локальных GPU; Проектировать и эксплуатировать масштабируемые LLM/ML-пайплайны и data-workflows. On-prem инфраструктуру. Prod, R&D, DR контуры; Деплоить, мониторить и оптимизировать сервисы LLM/ML-инференса (задержка, пропускная способность, autoscaling, стоимость); Строить и поддерживать data-инфраструктуру: ETL/ELT, batch/stream-обработку, слои хранения (SQL/NoSQL, object storage, data lake/warehouse). Выстраивать интеграции разных источников данных с низкой задержкой; End-to-end производительность: профилирование узких мест по данным и инференсу, поставка оптимизаций; Укреплять надёжность и безопасность: observability/наблюдаемость, алерты, доступы, аудит-трейлы, DR; Запускать сервисы с нуля и доводить до продакшена. Требования: 5+ лет в MLOps/Devops; 3+ лет опыта работы с LLM/ML в production (обязательно). Сильный Python и SQL. Практика GPU-инференса: профилирование, квантование, ONNX/TensorRT, Nvidia Triton. Опыт с LLM/RAG/мультиагентными фреймворками. Опыт с контейнерами и CI/CD. Понимание оркестрации, сетей и on-prem-хранилищ. Kafka, ClickHouse, Postgres, Airflow, векторные БД, k8s, DataSphere, LangChain, Kubeflow, Mlflow, Feast. Будет преимуществом: опыт с RU-fintech данными с биржи MOEX, новости Интерфакс, Cbonds, Market data, Tradingview. Условия: Комфортный офис в Москва Сити (гибридный формат работы); ДМС с первого дня работы, включающая стоматологию, страхование жизни и возможность подключения родственников; Сервис корпоративных скидок Best Benefit; Конкурентный уровень заработной платы.
Похожие вакансии