Мы — команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях (Text, Vision, Audio): SFT, RLHF, навыки, безопасность и продуктовые сценарии. Сейчас ищем специалистов в данные под проекты, связанные с ML на устройствах: офлайн-ассистент, локальное ASR, keyword spotting, VAD/EOU и персонализация. Направления задач: Данные для on-device ассистента - Сбор и подготовка данных для валидации и обучения локальных компонентов: ASR, spotter, VAD/EOU. Пайплайны данных - Построение процессов сбора, очистки, сегментации и разметки данных, включая работу с сырыми аудиоканалами и логами с устройств. Разметка и схемы аннотации - Проектирование и внедрение разметки для новых сценариев: офлайн-команды, EOU, VAD, персонализация. Данные под новые фичи - Подготовка датасетов для offline ASR, quick commands, offline assistant и персонализации. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!Обязанности подготовка данных для обучения и тестирования моделей разработка и поддержка data pipeline’ов анализ качества моделей через данные и метрики поиск точек роста и проблемных сценариев работа с продовыми и beta-логами устройств. Требования уверенный Python (алгоритмы, структуры данных, async) опыт работы с данными в ML-задачах понимание метрик качества моделей базовая статистика опыт в speech-задачах (ASR, VAD, diarization, keyword spotting) опыт построения data pipeline’ов опыт с разметкой и краудсорсингом. Условия крупнейшее DS&AI community — более 600 DS-специалистов банка дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира возможность быть соавтором НИРов и статей для международных конференций возможность выбрать удобный формат работы: гибрид или офис ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека выгоднее до 7% для каждого сотрудника бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии