Наша команда в управлении экспериментальных систем машинного обучения работает над созданием моделей Computer Operator (задачи управления компьютерами, телефонами, браузерами и т.п.). Мы прицельно улучшаем работу моделей в этих задачах, используя передовые методы обучения (такие как online RL в средах), а успешные результаты приземляем в продукты. Мы ищем AI Engineer, который займется подготовкой и проведением экспериментов с моделями. Обязанности подготовить сетап эксперимента по обучению новым RL-методом (выбрать данные и сформулировать гипотезу, подготовить трейнер/награды и т.д.) построить процесс rejection sampling и стратификации данных для получения оптимальной сложности обучающих сэмплов на каждой стадии обучения провести серию экспериментов по добавлению данных из других доменов, определить их влияние на качество работы модели в целевых задачах подготовить новый online-бенчмарк для замеров наших моделей. Требования хорошие знания в python 3.11, базовых структурах данных и алгоритмах умение писать эффективный код и отлаживать его современными инструментами, поддерживать порядок в проекте 2+ года опыта работы с обучением NLP моделей, отличное знание базы по Deep Learning, опыт в Supervised Fine-Tuning моделей библиотеки PyTorch, Transformers, vLLM, опыт обучения моделей на кластерах GPU git, опыт работы с Pull/Merge Requests, опыт работы с s3-like хранилищами. Условия комфортный современный офис - м. Кутузовская ежегодный пересмотр зарплаты, годовой бонус корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера корпоративная пенсионная программа.
Похожие вакансии