Наша команда занимается R&D и бизнес внедрением метрики CLTV (Client Life-Time Value) по клиентам – физическим лицам Сбербанка. Мы ищем Data Scientist’a для работы с моделями последовательностей событий (Transformer, LSTM, RNN) и c классическим машинным обучением на табличных данных (gradient boosting, RF), который сможет имплементировать SOTA ML-решения в модели прогнозирования CLTV. Обязанности Основные зоны ответственности в рамках направления: · Разработка ML-моделей для базы 100+ млн розничных клиентов Сбербанка · Создание и тестирование представлений клиентов (embeddings) для использования в моделях · · Работа с огромными массивами данных (Spark, Hadoop, GreenPlum) · · Разработка подхода по расчету чувствительности прогнозов к изменению входных параметров (эластичность к действиям банка/свойствам клиента) · · Взаимодействие с командой внешних R&D исследователей · · Поиск, объединение и нормализация данных · · Работа с командой DS-разработчиков, менторство, постановка задач на разработку · Отличные знания в области классического data science / математики / статистики · · Опыт работы с BigData (Hadoop, hdfs, pyspark) – преимущество · · Опыт A/B тестирования – преимущество · · Понимание принципа работы банковского или финансового бизнеса – преимущество · Требования · Отличные знания в области классического data science / математики / статистики · · Опыт работы с BigData (Hadoop, hdfs, pyspark) – преимущество · · Опыт A/B тестирования – преимущество · · Понимание принципа работы банковского или финансового бизнеса – преимущество · Условия · Конкурентную компенсацию · Гибридный график работы при желании (1-2 дня работа из дома) Огромные массивы данных · Дружную команду профессионалов (МФТИ, ВШЭ, МГУ, РЭШ, Сколтех) · Комфортабельный офис недалеко от метро Кутузовская с корпоративным фитнесом · Оформление по ТК РФ · ДМС · Бесплатный спортзал · Бесплатный кофе/печенки на этаже · Возможность развития и участия в DS/DA сообществе Сбербанка (более 1000 DS/DA банка)