Наша команда создает нового ассистента в новой AI-first парадигме, перед нами стоит цель сделать сервисы экосистемы банка удобнее и доступнее. Мы строим взаимодействие с пользователем, которое будет нативно встраиваться в агентную систему и строить интерфейс на лету. Наша команда совершенствует подходы по работе с цифровыми ассистентами за счет использования собственной большой языковой модели - GigaChat и фреймворков по работе с ней. Мы ищем сильного специалиста, которому интересно не только обучать модели, но и разбираться в устройстве пайплайнов, качестве данных, масштабировании запуска и воспроизводимости результатов. Для нас важны исследовательское мышление, аккуратность в экспериментах и готовность доводить идеи до практического результата.Обязанности разрабатывать и сопровождать пайплайны обучения генеративных моделей готовить, проверять и дорабатывать датасеты для обучения, валидации и тестирования запускать и оптимизировать distributed training на GPU-инфраструктуре проводить эксперименты с новыми архитектурными подходами и режимами обучения анализировать результаты экспериментов, формулировать выводы и доводить исследования до воспроизводимого состояния изучать свежие статьи и проверять перспективные идеи на практике участвовать в развитии инженерного контура обучения: окружение, запуск, мониторинг, стабильность, воспроизводимость Требования уверенное владение Python опыт работы с PyTorch и Torch Lightning опыт работы с Ray опыт запуска обучения на CUDA понимание того, как строятся и запускаются обучающие пайплайны опыт работы с датасетами для ML-задач понимание distributed training и практический опыт его использования опыт работы в Linux-окружении опыт использования Docker опыт обучения генеративных моделей Будет плюсом: опыт работы с большими обучающими запусками и длительными экспериментами понимание особенностей воспроизводимости ML-экспериментов опыт профилирования и оптимизации обучения на GPU опыт работы с пайплайнами подготовки данных навык чтения и критического разбора research papers интерес к новым архитектурам и нестандартным подходам в обучении моделей Условия гибридный формат работы (2-3 дня офис Кутузовская 32к1) годовой бонус и ежегодный пересмотр расширенный ДМС с первого дня + стоматология и льготное страхование для семьи корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях офис на Кутузовской с видом на набережную, зонами отдыха и спортзалом 90 дней удаленной работы из любого региона РФ (не применимо для сопровождения) льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.
Похожие вакансии