other

Senior NLP Engineer со знанием и опытом в Reinforcement Learning

Более недели назад

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Привет! Это GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна. Направления Улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов. Развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей. Улучшение продукта Deep Research На эти роли мы ищем талантливого NLP Engineer со знанием и опытом в Reinforcement Learning. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.Обязанности Улучшать качество работы GigaChat Reasoning на русском и английском языках Ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг. Тестировать новые Loss-функции и подходы к обучению Помогать выводить в прод всё, что мы обучим. Постоянно держаться up-to-date со свежими статьями. Требования Опыт в online RL и хорошие теоретические знания Уверенное владение Python, PyTorch. Знание базовых алгоритмов и математики. Знания в DL, опыт обучения простых и больших моделей. Опыт обучения моделей для продакшена. Понимание текущего состояния эволюции больших LLM'ов. Будет плюсом наличие публикаций. Условия Удалённо по России. * Возможность оформления в IT-аккредитованную компанию * Годовая премия по итогам работы до 6 окладов. * Регулярный пересмотр зарплат. * Корпоративный спортзал и зоны отдыха. * Более 400 программ СберУниверситета для роста. * Программа адаптации и помощь руководителя на старте. * Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы. * Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа. * Ипотека для сотрудников по дисконтной программе. * СберПрайм+ и скидки у партнёров. * Бонус за рекомендации в команду

Показать контакты

Имя не указано

Пожаловаться ID: 152032436

Похожие вакансии

Senior NLP Engineer

Договорная

Москва

СБЕР

Senior ML Engineer (NLP, GigaChat Audio)

Договорная

Москва

СБЕР