Привет! Это GigaChat Vision — команда, которая делает полный цикл обучения VLM моделей, включающий в себя стадии pre-training, SFT и DPO/RL. Мы ищем сильных инженеров и исследователей, которые будут двигать вперед качество мультимодального GigaChat. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!Обязанности Самостоятельная работа в рамках заданного направления развития качества VLM: от планирования, до выкатки в прод; Планирование и работа над исследовательскими задачами по архитектуре модели, стратегии и данным обучения; Формирование гипотез по улучшению качества модели, самостоятельное планирование экспериментов по их подтверждению и постановка multi-node обучений на большом количестве GPU (тысячи A100/H100); Решение сложных инженерных задач, развитие и оптимизация кодовой базы обучения и эвала VLM, написание чистого кода и проведение code review; Анализ точек роста и определение способов их закрытия. Требования Сильный технический бэкграунд в modern ML: понимание того, как данные, архитектура и стратегии обучения влияют на итоговое качество модели; Опыт полного цикла обучения VLM или LLM; Глубокие знания или опыт работы в области computer vision; Понимание принципов работы распределенного обучения (FSDP) или опыт обучения моделей на больших GPU кластерах; Наличие навыков технического лидерства: проведение code-review, помощь и менторинг младших сотрудников; Умение работать, принимать решения и выстраивать процессы в условиях неопределенности; Умение и желание взаимодействовать с коллегами, вносить собственные идеи и предлагать пути достижения общих целей. Условия Будет плюсом: Опыт полного цикла обучения VLM; Наличие публикаций в области NLP или CV; Опыт решения задач по оптимизации обучения; Опыт участия в соревнованиях по машинному обучению или программированию.
Похожие вакансии