Обязанности:
О роли Мы ищем Senior ML Engineer для создания инфраструктуры машинного обучения для системы скоринга удержания пользователей. Это greenfield-проект: вы будете первым ML-инженером в команде и построите платформу с нуля — от обработки данных и feature engineering до production-инференса и мониторинга. Ваша задача — создать надежную ML-инфраструктуру: воспроизводимые данные и признаки, стабильный процесс обучения моделей, batch и near-real-time инференс, а также систему мониторинга и автоматического переобучения. Задачи Инфраструктура данных и признаков Разработка и поддержка time-based feature pipelines (rolling windows, накопительные и decay-метрики) Обеспечение полного соответствия признаков между обучением и инференсом Возможность воспроизводить датасеты для любой даты скоринга Production-внедрение моделей Вывод в production моделей для табличных данных (CatBoost / XGBoost) Упаковка обучения и инференса в модульные сервисы (batch → real-time) Версионирование данных, признаков и моделей Мониторинг и надежность Мониторинг качества данных и дрейфа распределений Отслеживание деградации моделей Настройка алертов и процедур быстрого восстановления Архитектура Проектирование простой и экономичной инфраструктуры в облаке Использование Docker-first подхода Kubernetes — там, где это действительно необходимо Минимизация vendor lock-in Ожидаемые результаты в первые 1–1,5 месяца Рабочий batch-pipeline скоринга end-to-end Feature pipeline с окнами 7/14/30/60 дней Воспроизводимые запуски обучения (MLflow или аналог) Настроенный мониторинг качества данных Краткая документация по эксплуатации системы Технологический стек Языки: Python (экспертный уровень), SQL ML: CatBoost / XGBoost, работа с табличными данными Serving: FastAPI, Docker, Kubernetes MLOps: MLflow, Airflow / Prefect / Dagster Cloud: AWS или аналогичные решения CI/CD: GitHub Actions / GitLab CI Будет плюсом: dbt Требования От 3 лет опыта в ML Engineering / MLOps Опыт вывода ML-моделей в production Работа с транзакционными или событийными табличными данными Понимание time-based feature engineering и data leakage Уверенная работа с Docker и масштабированием сервисов Инженерный подход: тестируемый, модульный production-код Будет плюсом Опыт в высоконагруженных продуктовых системах Знание ClickHouse / Kafka / Spark Опыт внедрения explainability (например, SHAP) Мы предлагаем Возможность с нуля построить ML-платформу и влиять на архитектуру Реальное влияние на ключевые продуктовые метрики Работа в команде, создающей новый AI-продукт Конкурентную заработную плату Профессиональный рост и технологически сложные задачиПохожие вакансии