other

Vision Pretain Data Lead (VLM, GigaChat Vision)

8 июня 2026

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 6 лет

Pretrain - является самым масштабным и затратным этапом обучения VLM. На нем закладывается огромный фундамент возможностей модели, который позволяет в дальнейшем ей быть полезной пользователю и решать задачи CV. Нам требуется эксперт, который понимает какие данные двигают качество, весь скоуп задач компьютерного зрения и подходы к их решению, будет собирать процессы вокруг обогащения претрейна самыми качественными и необходимыми данными для множества доменов, оценивать качество и сложность датасетов, создавать полезные дашборды, заботиться о воспроизводимости. Нужен хороший организатор дата-команды и дата-пайплайнов с сильными техническими навыками. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным! Обязанности строить data engine для pretrain и stage 1.5; отвечать за sourcing, curation, dedup, filtering, balancing и mixture design; выявлять слабые места в данных, влияющие на качество модели, составлять план по улучшению и реализовывать план в срок; управлять качеством данных и воспроизводимостью; организовывать статистику, срезы и мониторинг по данным; работать с training/eval командами; приоритизировать ручную и полуавтоматическую обработку там, где это эффективнее полной автоматизации; нанимать и вести дата-инженеров. Требования опыт работы в production команде (сборка окружения, выкатка моделей как оффлайн, так и онлайн, большие нагрузки как преимущество); понимание, как данные влияют на качество VLM; опыт построения дата пайплайнов и data quality процессов; умение ставить задачи дата-инженерам, девопсам/ML-опсам, ML разработчикам; умение приоритизировать задачи, распределять имеющиеся ресурсы; Условия крупнейшее DS&AI community — более 600 DS-специалистов банка дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира возможность быть соавтором НИРов и статей для международных конференций возможность выбрать удобный формат работы: гибрид или офис ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека выгоднее до 7% для каждого сотрудника бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.

Показать контакты

Имя не указано

Пожаловаться ID: 153231517

Похожие вакансии

Vision RL Lead (VLM, GigaChat Vision)

Договорная

Москва

СБЕР

Data Engineer for VLM Training Data (GigaChat Vision)

Договорная

Москва

СБЕР

Head of ML (VLM, GigaChat Vision)

Договорная

Москва

СБЕР

Senior Data Engineer (GigaChat Vision)

Договорная

Москва

СБЕР

Data Scientist (Computer Vision)

Договорная

Москва

НТехЛаб

Senior RL - Engineer (GigaChat Vision)

Договорная

Москва

СБЕР