Обязанности:
Чем предстоит заниматься: Подготовка данных для валидации: сбор выборок, целевых переменных (таргетов) и признаков из распределённых хранилищ данных; формирование и проверка SAMPLE, TARGET, FEATURES-наборов проверка качества данных: дубликаты, пропуски, выбросы, смещение распределений; анализ датасетов на соответствие техническим и бизнес-требованиям. Поддержка валидационных проектов: участие в валидации моделей разных продуктов (CLTV, Antifraud, CC, Corp MMB и др.); поддержка различных веток валидации (с разной логикой сбора данных и таргетов). Наши пожелания к кандидатам: Опыт работы с SQL / Impala (написание сложных запросов, оптимизация); Опыт работы с Hadoop / Spark (работа с большими объёмами данных); Знание базовых статистических метрик для моделей (KS, PSI, GINI, AUC, IV); Опыт обработки и подготовки данных: pandas, PySpark; Опыт работы с Jupyter Notebook; Базовое понимание ML-моделей (классификация, регрессия, калибровка); Внимательность к деталям и аккуратность при работе с данными; Готовность работать с регуляторной документацией. Что мы предлагаем: Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования; Корпоративные и внешние программы обучения; Чувство локтя: у нас дружелюбная атмосфера и команда лучших профессионалов, которые готовы делиться с тобой экспертизой; Забота о твоем здоровье: программа ДМС, куда входит стоматология и обслуживание в лучших клиниках города, скидки на абонементы в фитнес-клубы, неформальные спортивные сообщества; Возможности для разнообразного досуга: скидки на услуги туристических агентств, продукты питания, в рестораны и бары, в магазины и салоны красоты; Предложения от банка только для сотрудников: льготные условия обслуживания на карты Cash Back и другие предложения.Похожие вакансии
Инженер сопровождения/Дата инженер (сопровождение дата продуктов)
Договорная
Москва. Станции метро: Комсомольская
ГК Орбита