Обязанности:
Команда Департамента Анализа данных и моделирования нацелена на максимально эффективное использование данных. Мы верим, что можем сделать Банк лучшим для внутреннего и внешнего клиента за счет датацентричности и проникновения моделирования во все сферы деятельности. Управление алгоритмов машинного обучения занимается развитием компьютерного зрения, речевых технологий, графов и гео. Задачи, которые мы тебе доверим:• имплементация и обучение SOTA NLP моделей, как для русского языка, так и мультиязычных;• эксперименты по созданию новых архитектур, оценка языковых моделей;• работа над созданием надежного, быстрого и масштабируемого пайплайна для обучения LLM;• адаптация LLM для задач обслуживания внутренних и внешних клиентов, адаптация LLM под специфичные домены;• задачи полнотекстового анализа: кластеризация, классификация, тематическое моделирование, выделение именованных сущностей, суммаризация, идентификация трендов, анализ тональности; • речевая аналитика (оценка качества работы операторов, формирование рекомендации);• анализ обращений и отзывов;• разработка чат-ботов;• применение ML/DL на KG и базах знаний;• тестирование данных, гипотез, моделей;• доведение разработанной модели до вывода в production;• общение с продуктовой командой, бизнес-заказчиком и определять компоненты ml-продуктов;• разработка system design решений;• управление полным циклом разработки: взаимодействие с аналитиками, дата инженерами, MLOps- и DevOps-специалистами. Наши ожидания от кандидата: • высшее техническое/математическое образование;• опыт работы DS от 3 лет;• понимание принципов классического ML, владение стандартным набором python-библиотек для ML;• опыт работы с NLP, понимание текущего состояния в области NLP (отдельные архитектуры, конкретные приложения к задачам);• опыт работы с языковыми моделями, понимание подходов к обучению LLM;• хорошее понимание современных архитектур нейронных сетей;• умение читать и разбирать статьи о новых архитектурах и подходах;• понимание принципов обучения, тюнинга, оценки deep learning моделей;• опыт отладки нейронных сетей и модификации архитектур или создания собственных;• опыт внедрения моделей в production, построения промышленных NLP решений с применением DL алгоритмов;• понимание принципов ведения разработки, ведения документации;• умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;• способность самостоятельно делать R&D в новых темах;• умение работать в команде;• уверенное знание SQL, Python, PyTorch, Docker, Hadoop, DVC, git. Что мы предлагаем: • полностью удаленный формат работы из любого города; • уровень зп обсуждается по итогу собеседования, но у нас также есть премиальная и бонусная система выплат и регулярные процедуры пересмотра уровня зп и грейда; • возможность прокачать персональный бренд, участвуя в профессиональных конференциях и делая публикации с помощью команды DevRel.