Pretrain - является самым масштабным и затратным этапом обучения VLM. На нем закладывается огромный фундамент возможностей модели, который позволяет в дальнейшем ей быть полезной пользователю и решать задачи CV. Нам требуется эксперт, который понимает какие данные растят качество, понимает весь скоуп задач компьютерного зрения и подходы к их решению. Нужно будет строить новые и совершенствовать имеющиеся процессы вокруг обогащения претрейна максимально качественными данными для множества необходимых доменов, оценивать качество и сложность датасетов, создавать полезные дашборды, заботиться о версионируемости и воспроизводимости. Нужен хороший организатор дата-команды и дата-пайплайнов с сильными техническими навыками. Обязанности Строить data engine для pretrain vlm; Отвечать за sourcing, curation, dedup, filtering, balancing и mixture design; Выявлять слабые места и точки роста в данных, влияющие на качество модели, Составлять план по улучшению и реализовывать план в срок; Управлять качеством данных и воспроизводимостью; Делать мониторинги/дашборды для процессов над данными; Взаимодействовать с training/infra/eval командами; Нанимать и вести Data/ML-инженеров Требования Опыт работы с SQL/noSQL хранилищами, map-reduce, s3; Опыт построения дата пайплайнов и data quality процессов; Опыт работы в production ml команде (большие нагрузки как преимущество); Понимание задач CV и современных подходов в мультимодальных языковых моделях; Понимание, как данные влияют на качество VLM; Умение ставить задачи дата-инженерам, девопсам/ML-опсам, ML разработчикам; Умение планировать, приоритизировать задачи, распределять имеющиеся ресурсы; Условия Комфортный современный офис рядом с м. Кутузовская. Возможность выбрать удобный график – офис/гибрид и также работать на удаленке три месяца в год. Ежегодный пересмотр зарплаты, годовая премия. Корпоративный спортзал и зоны отдыха. Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития. Программа адаптации и помощь руководителя на старте (для Junior позиций). Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа. Льготная ипотека для каждого сотрудника. Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров. Вознаграждение за рекомендацию друзей в команду Сбера. Корпоративная пенсионная программа. Отсутствие строгого дресс-кода.
Похожие вакансии