Мы ищем сильного Deep Learning инженера для развития и вывода на принципиально новый уровень GigaAM — лучшей open-source модели для распознавания речи на русском языке. GigaAM — это не только исследовательский проект, но и core-модель, которая определяет качество работы многих ключевых продуктов экосистемы: GigaChat Audio, ASR, TTS, GigaChat Video и других. Сейчас мы стоим перед масштабным вызовом: кратное увеличение параметров модели, масштабирование данных на несколько порядков, расширение языкового покрытия и выход за рамки распознавания речи в сторону general audio understanding. Если вы хотите создавать state-of-the-art решения, которыми будут пользоваться миллионы, и вносить вклад в развитие мирового open-source — нам по пути! Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!Обязанности Масштабирование данных: увеличение объемов данных для обучения на несколько порядков, построение эффективных пайплайнов их фильтрации и подготовки. Развитие архитектуры и метода предобучения: улучшение мультиязычных свойств модели и расширение ее возможностей в сторону анализа аудио неречевой природы. Scaling laws: масштабирование модели по количеству параметров в несколько раз. Research & Engineering: стабилизация процессов предобучения, проведение ML-экспериментов, проверка гипотез и доведение результатов до прода и публикаций. Требования уверенное владение Python и PyTorch Distributed Training: практический опыт распределенного обучения, понимание ограничений и принципов работы под капотом (DDP, FSDP, ZeRO). Опыт оптимизации DL-пайплайнов: профилирование и оптимизация узких инфраструктурных мест в процессе обучения (I/O bottlenecks, memory management, GPU utilization). Экспертиза в Speech/Audio: понимание современных подходов и state-of-the-art архитектур в Speech/Audio Self-Supervised Learning.Условия крупнейшее DS&AI community — более 600 DS-специалистов банка дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира возможность быть соавтором НИРов и статей для международных конференций возможность выбрать удобный формат работы: гибрид или офис ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека выгоднее до 7% для каждого сотрудника бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии