Обязанности:
ПРОЕКТ: В команду Корпоративно-Инвестиционного бизнеса ищем разработчиков для создания автоматизированной системы присвоения клиентам банка классификационного кода по отраслевому признаку. В рамках нового приоритетного направления будем разрабатывать систему определения принадлежности клиентов к той или иной отрасли. В процессе реализации нам потребуется разработать высоконагруженную систему с трёхуровневой архитектурой (front-middle-back), а также внутренним аналитическим хранилищем, обладающую гибкой системой администрирования и расчётов.Стандартный̆ проект включает в себя все этапы: от аналитики, проверки гипотез до написания промышленного кода и внедрения в пром. Инфраструктура: С данными мы работаем на PySpark на вычислительном Hadoop-кластере, модели учим на ML библиотеках Python, для контроля версий используем BitBucket, а для ведения задач - Jira. ЧТО МЫ ОЖИДАЕМ ОТ КАНДИДАТА: Опыт работы: не менее 2 лет в области Data Science. Наличие реализованных и внедренных решений (наличие репозитория с проектами). Умение интерпретировать и обосновывать результаты работы моделей в доступном для бизнеса формате. Опыт постановки и проведения ad-hoc исследований, оценка их качества. Понимание основных алгоритмов ML (линейные, ядерные модели, наивный байес, деревья, случайный лес, градиентный бустинг), метрик качества и функций потерь. Умение обосновать выбор модели/метрики/функции потерь для конкретной задачи. Опыт предобработки сырых данных (заполнение пропусков, обработка выбросов и т.п.). Умение отобрать важные признаки и сгенерировать новые из текущего набора. Хорошие навыки программирования: Python (обязательно: pandas, numpy, scikit-learn, matplotlib/plotly/аналог, xgboost + lightgbm/catboost; желательно: shap, hyperopt/optuna/аналог, keras/tensorflow/pytorch). SQL (сложные запросы, индексы, оконные функции). Желателен опыт работы с Hadoop: общее понимание архитектуры, Hive (HiveQL), Spark (PySpark/Scala). Опыт работы с linux терминалом. Знакомство с методологией Agile и основными фреймворками. Опыт работы в Git (используем BitBucket), Jira, Confluence приветствуется. Готовность изучать новое, исследовать международный опыт и делится знаниями. ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: Общаться с бизнес-аналитиком со стороны заказчика. Разработка кода для формирования витрин данных. Отработка гипотез и поиск оптимальной модели. Построение интерпретируемых моделей. Внедрение модели в промышленную среду. Улучшение действующих моделей. МЫ ПРЕДЛАГАЕМ: Возможность участия в интересных проектах. Возможность профессионального и карьерного роста в компании. Опыт работы в команде профессионалов. Денежный Welcome бонус. Специальные тарифы для сотрудников в спортивные клубы и языковые курсы и пр. Офисный формат работы в Санкт-Петербурге.