Ищем Middle / Senior ML Engineer / Researcher в исследовательскую команду для работы над созданием архитектуры инструктивного редактирования аудио, речи и музыки — от голосовой конверсии до сложных мультитрековых трансформаций.Обязанности разработка моделей инструктивного редактирования аудио (“сделай голос ниже”, “убери шум”, “переведи и сохрани тембр”) конверсия голоса, speech-to-speech translation, style & emotion transfer генерация и редактирование музыкальных дорожек: pitch, tempo, timbre, arrangement работа с diffusion / autoregressive аудио-моделями построение универсальных аудио-репрезентаций для разных задач обучение, валидация и масштабирование моделей на больших аудио-корпусах Требования отличный Python 3, опыт с PyTorch, bash, git, Docker, dvc, HF Transformers хорошее понимание ASR, TTS, DSP ML, speech & audio processing понимание трансформеров, attention-механизмов, KV-cache, diffusion навыки работы с большими датасетами аудио понимание MLOps-практик: мониторинг моделей, дрейф данных, CI/CD умение быстро разбирать и воспроизводить идеи из научных статей Будет плюсом: опыт работы с диффузионными и авторегрессионными архитектурами для аудио/музыки знание мультимодальных LLM / VLM / Audio-LM публикации, open-source вклад или исследовательский опыт в соответствующих областях. Условия комфортный современный офис - м. Кутузовская ежегодный пересмотр зарплаты, годовой бонус корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера корпоративная пенсионная программа.
Похожие вакансии