Обязанности:
Мы — команда, разрабатывающая аналитическую платформу. Одна из задач команды – объединить аналитику, обучение моделей и их внедрение в продукт для различных команд Авиасейлс на базе дата платформы. Наша цель – создать универсальную структуру, которая позволит эффективно интегрировать разные модели. Что нужно будет делать: проектирование и сопровождение дата пайплайнов необходимых для работы МЛ платформы; разработка и поддержка офлайн (batch) сервисов обучения и инференса ML-моделей; деплоить модели в продакшн, обеспечивать их стабильность работы и масштабируемость, разрабатывать систему мониторинга; анализировать качество моделей; сотрудничать с разными командами разработки и аналитики для интеграции моделей в прод. Что мы ждем от тебя: опыт работы в Data Engineering/ML не менее 3 лет; уверенное владение SQL, Python. Понимание Lakehouse концепций; опыт работы с построением моделей (линейные/деревянные модели, ансамбли) для разных задач (регрессия, классификация, кластеризация, временные ряды и так далее); навыки работы с контейнерами (Docker, Kubernetes), CI/CD(Jenkins), мониторингом (Prometheus, Grafana); желание и способность работать в команде, обмениваться знаниями и опытом. Будет плюсом: опыт с Apache Airflow, DBT, Apache Spark, Trino, Kafka, ClickHouse, S3, MLFlow; умение анализировать качество моделей с использованием различных классических и кастомных метрик; опыт работы с большими объемами данных и оптимизацией производительности моделей. Как мы работаем: в любой точке мира: не привязываемся к локации, платим в долларах, любим путешествовать; без бюрократии: удобные процессы здорового человека, горизонтальные и открытые коммуникации, быстрое обсуждение идей и принятие решений; компенсируем: ДМС, психотерапию или иностранные языки, занятия спортом и больничный; на райском острове: можно работать на Пхукете с видом на океан.Похожие вакансии