Обязанности:
Ozon Банк — это подразделение Ozon, где тесно переплетаются финансы и IT. Мы создаём инновационные продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и результаты. Мы ищем профессионала, который сможет внести значительный вклад в развитие нашей команды кредитного скоринга для розничных клиентов. Нужен человек, знакомый с классическим подходом к моделированию рисков. При этом способный генерировать и реализовывать идеи, как превзойти текущие стандарты индустрии. Для этого у нас есть возможность объединить типичные для финансового сектора данные с данными клиентов Ozon (очень много данных). А применить наработки можно на большой базе клиентов Маркетплейса.Основной стек: Python, Hadoop, Vertica, Pyspark, Git, Airflow. Вам предстоит Разрабатывать и поддерживать ML-модели для кредитования физических лиц (PD, LGD, EAD, модель дохода и тд) Выводить в прод разработанные модели с помощью нашей ML платформы. Развивать внутренний фреймворк для разработки моделей Генерировать новые фичи и записывать в feature store (кстати их 2, отдельно для разработки моделей, отдельно для использования в онлайн в проде) Участвовать в постановке задачи, находить приоритетные направления для моделирования и прозрачно об этом рассказывать Анализировать эффективность моделей в проде, организовывать и дорабатывать мониторинг. Мы ожидаем Опыт работы в кредитном скоринге от 3 лет Понимание, как провалидировать модели и как организовать мониторинг так, чтобы минимизировать модельные риски Умение работать с данными. Селектить откуда угодно. Генерировать крутые фичи для моделей. Вычислительно эффективно и с самопроверкой. Глубокие знания теорвера, машинного обучения, типовых пайплайнов обучения моделей (да, банально, но нужно) Опыт работы c пакетами для анализа данных и построения ML моделей на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, hyperopr, optuna, etc) (да, тоже банально, но как без этого?) Будет плюсом Опыт работы с HDFS и Pyspark Навыки использования deep learning алгоритмов Навыки создания дагов Airflow и их последующее сопровождение Опыт в разработке, выводе в прод и поддержке сервисов для онлайн расчета моделей машинного обучения