other

RL+NLP Разработчик

Более недели назад

От 160 000 до 200 000 руб.

Город: Москва

МФТИ

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Обязанности: Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов. Требования: Обязательное наличие оконченного высшего технического образования Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах Опыт применения RL для обучения языковых или reasoning-моделей Понимание архитектуры и механизмов обучения больших языковых моделей Свободное владение техническим английским языком. Условия: работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех); оформление в соответствии с ТК РФ; возможность бесплатного посещения бассейна и тренажерного зала; в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.

Показать контакты

Имя не указано

Пожаловаться ID: 148208658

Похожие вакансии

RL Разработчик

От 250 000 до 250 000 руб.

Москва

МФТИ

Стажер-NLP- Разработчик

Договорная

Москва

РСХБ-Интех

RL - инженер

Договорная

Москва

Автономные Технологии

Разработчик проекта ИИ (БПЛА, LLM, CV, RL)

Договорная

Москва

Федеральный Центр Оценки Безопасности и Качества Продукции Агропромышленного Комплекса

NLP Lead

Договорная

Москва

red_mad_robot