Обязанности:
SberDevices — инновационное направление экосистемы Сбера, которое создает умные устройства, виртуальных ассистентов и платформенные решения в области NLP, computer vision, speech и ML-инфраструктуры. Команда ML HomeOS ищет ML Engineer, который будет заниматься обучением и адаптацией языковых моделей для пользовательских сценариев умных устройств: голосовой ассистент, управление HomeOS, персонализация и контекстное понимание, с фокусом на продакшен-качество и масштабирование.Чем ты будешь заниматься: обучение и дообучение языковых моделей: continued pretraining / domain-adaptive pretraining под задачи HomeOS проведение Supervised Fine-Tuning (SFT) для decoder-only LLM, обучение и адаптация encoder-моделей под прикладные сценарии применение и развитие parameter-efficient fine-tuning подходов: LoRA / adapters / prefix- и prompt-tuning обучение и адаптация BERT-подобных encoder-моделей, а также классификаторов и encoder / seq2seq моделей для NLP-задач составление требований для датасетов SFT построение и поддержка пайплайнов обучения и переобучения моделей оптимизация моделей под продакшен-ограничения (latency, память, масштабирование) взаимодействие с инфраструктурными командами при интеграции моделей в ML-платформу HomeOS. Мы ожидаем: опыт работы в ML / NLP от 3 лет практический опыт fine-tuning трансформеров опыт работы с LoRA / adapters / PEFT-подходами понимание архитектур ecoder-only, decoder-only, encoder-decoder) опыт обучения классификаторов и encoder / seq2seq моделей понимание ML-продакшена: воспроизводимость, версионирование, стабильность и воспроизводимость инференса опыт оптимизации обучения и инференса моделей навыки построения ML-пайплайнов и работы с оркестраторами. Будет плюсом: опыт участия в pretraining или large-scale fine-tuning проектах понимание особенностей продакшен-эксплуатации LLM опыт domain adaptation (continued pretraining, SFT, data-centric подходы) под закрытые или специфичные домены опыт распределённого обучения и оптимизации инференса опыт работы с ML-инфраструктурой для high-load систем опыт работы с: RLHF / preference optimization Distillation / quantization Inference optimization (KV-cache, batching и др.) Условия гибридный формат работы (м Новослободская) годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития регулярные митапы и развитое DS-community расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбер.Похожие вакансии