other

Vision Pretain Data Lead (VLM, GigaChat Vision)

Более недели назад

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 6 лет

Pretrain - является самым масштабным и затратным этапом обучения VLM. На нем закладывается огромный фундамент возможностей модели, который позволяет в дальнейшем ей быть полезной пользователю и решать задачи CV. Нам требуется эксперт, который понимает какие данные двигают качество, весь скоуп задач компьютерного зрения и подходы к их решению, будет собирать процессы вокруг обогащения претрейна самыми качественными и необходимыми данными для множества доменов, оценивать качество и сложность датасетов, создавать полезные дашборды, заботиться о воспроизводимости. Нужен хороший организатор дата-команды и дата-пайплайнов с сильными техническими навыками. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным! Обязанности строить data engine для pretrain и stage 1.5; отвечать за sourcing, curation, dedup, filtering, balancing и mixture design; выявлять слабые места в данных, влияющие на качество модели, составлять план по улучшению и реализовывать план в срок; управлять качеством данных и воспроизводимостью; организовывать статистику, срезы и мониторинг по данным; работать с training/eval командами; приоритизировать ручную и полуавтоматическую обработку там, где это эффективнее полной автоматизации; нанимать и вести дата-инженеров. Требования опыт работы в production команде (сборка окружения, выкатка моделей как оффлайн, так и онлайн, большие нагрузки как преимущество); понимание, как данные влияют на качество VLM; опыт построения дата пайплайнов и data quality процессов; умение ставить задачи дата-инженерам, девопсам/ML-опсам, ML разработчикам; умение приоритизировать задачи, распределять имеющиеся ресурсы; Условия крупнейшее DS&AI community — более 600 DS-специалистов банка дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира возможность быть соавтором НИРов и статей для международных конференций возможность выбрать удобный формат работы: гибрид или офис ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека выгоднее до 7% для каждого сотрудника бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.

Показать контакты

Имя не указано

Пожаловаться ID: 153231517

Похожие вакансии

Vision RL Lead (VLM, GigaChat Vision)

Договорная

Москва

СБЕР

Vision Pretain Data Lead

Договорная

Москва

СБЕР

Head of ML (VLM, GigaChat Vision)

Договорная

Москва

СБЕР

Senior DL-engineer (GigaChat Vision)

Договорная

Москва

СБЕР

Senior RL - Engineer (GigaChat Vision)

Договорная

Москва

СБЕР

Lead ML Engineer (Computer Vision)

Договорная

Москва

Центральный банк Российской Федерации (Банк России)