Обязанности: работа с Hadoop (Impala, Spark) в Jupyter Hub; наиболее часто применяемые методы: деревья решений, бустинги, лог.регрессия, различные методы кластеризации, ALS/SVD, методы NLP, нейросети для анализа транзакционных данных, текстовой аналитики, для создания эмбеддингов; примеры задач: профилирование и сегментирование клиентов, анализ интересов, склонностей к определенным видам кредитных и некредитных продуктов, к категориям транзакций, прогнозирование уровня удовлетворенности клиентов сервисами банка и каналами взаимодействия, аналитика точек продаж, анализ инвестиционного риск-аппетита клиентов, задачи оптимизации, выявление родственных связей, анализ отзывов в сети Интернет и суммаризация текстов обращений, задачи поиска шаблонов в смс, прогнозирование LTV и др. активный knowledge sharing внутри команды и управления, brainstorming; выступаем на конференциях, публикуем статьи, по возможности занимаемся RnD; ведение проектов по Agile/Scrum в Cфера (аналог Jira и Confluence), Gitlab+BitBucket+MLFlow. Требования: опыт работы в моделировании от 1 года; уверенное владение Python, Spark; знание алгоритмов ML: деревьев решений и случайных лесов, регрессии, бустингов, кластеризации, временных рядов и др., понимание принципов работы рекомендательных систем и лежащих в основе алгоритмов, опыт работы с текстовыми данными приветствуется (NLP: тематическое моделирование, поиск ключевых слов, анализ тональности, задачи суммаризации, шаблонизации и др.); знание DL приветствуется: опыт обучения и использования нейросетей и предобученных моделей (RNN, LSTM, BERT, GPT); опыт написания ТЗ, БТ, проектной документации; наличие публикаций по ML/DL, опыт выступления на ML-конференциях – как плюс; ценится проактивный и творческий подход в решении задач.
Senior Data Scientist (ML-модели, NLP)
Договорная
Москва
Центральный банк Российской Федерации (Банк России)