Обязанности:
R1 — это новый взгляд на пространство, в котором живет человек. Наша команда убеждена, что технологии способны сделать дом многофункциональным, удобным и универсальным как для семейных вечеров, так и для работы днем. Наша миссия — делать технологии понятными и доступными, чтобы каждый человек мог качественно улучшить свою жизнь, сделать собственный дом своим местом силы. Мы запустили уникальный проект по рестарту функции клиентоцентричных продаж в базу и максимизации ценности клиента (CVM). Цель проекта - создание системы для предложения клиентам нужных продуктов в правильное время с удобным клиентским опытом. В команду мы ищем Data Scientist’а с уклоном в MLOps для задач автоматизации ML пайплайнов. У нас много моделек, нужно дорабатывать и мониторить старые, параллельно внедряя новые.На текущий момент стек: JupyterHub, Hadoop (PySpark, Hive), Airflow, Luigi, ClickHouse, Gitlab, но параллельно переходим на работу в облаке с использованием Kubeflow, MLflow, Feast и пр.Задачи: Разрабатывать ML-модели, описывающие поведение клиентов (Churn, Propensity to buy, СJ-логики, CLTV, Uplift-модели пр.), используя SOTA алгоритмы машинного обучения; Визуализировать и интерпретировать результаты разработанных моделей для принятия решений управленческой командой (SHAP, Feature Importance и др.); Проектировать, поддерживать и внедрять в промышленную эксплуатацию пайплайны по формированию признаков и обучению ML-моделей на различных фреймворках; Инферить LLM в бизнес процессы; Проходить полный цикл жизни ML модели: от формализации требования от бизнеса, сбора данных, прототипирования до дизайна пилотов и внедрения в продакшен; Мы ожидаем: Опыт внедрения и автоматизации моделей в production. Работа с контейнерами (Docker, Kubernetes); Знание классического ML, мат статистики и теории вероятностей; Опыт в задачах классического скоринга (бинарные модели склонности к покупке, оттоку, метрики gini, Lift-кривая и пр.) или теоретическое понимание таких задач с желанием получить боевой опыт; Продвинутые знания Python и SQL (оконные функции и подзапросы): Опыт построения ML моделей (линейные модели, графовые модели, нейронные сети, ансамблевые алгоритмы); Опыт анализа ключевых показателей эффективности (AUC-ROC, R^2, Uplift@k и др.); Знание основных библиотек для анализа данных и машинного обучения (numpy, pandas, scikit-learn, pytorch, lightgbm, matplotlib); Опыт использования распределённых систем хранения и обработки данных (Hadoop, Spark, Spark Streaming) или желание быстро освоить; Опыт работы с системами контроля версий (Git / Bitbucket). Будет плюсом: Опыт написания ML моделей для персонализации маркетинга, математической оптимизации (MILP) и понимание теории Uplift моделирования (X-learner, T-learner, Uplift деревья). Мы предлагаем: Оформление по ТК РФ, полностью белая з/п; ДМС со стоматологией после испытательного срока, 100% компенсация больничного; Скидки от компаний-партнеров; Удаленка, гибрид или работа в офисе - на ваш выбор; Кроме того, R1 аккредитована как IT компания.