Обязанности:
Институт ИИ МФТИ – ведущий институт по искусственному интеллекту в России. В состав Института входят сильнейшие ученые и ключевые лаборатории Физтеха по направлениям: оптимизация для ИИ, Робототехника, Генеративный ИИ, Компьютерное зрение и Математическое моделирование. Цель Института - создание прорывных научных исследований и прикладных разработок для ключевых отраслей экономики страны. Немного о нас в цифрах: 1-е место среди технических вузов России в международных рейтинге THE и CWUR (2025); 1-е место в предметном рейтинге RAEX по направлению "Информационные технологии" (2025); 1-е место в рейтинге передовых инженерных школ (2025); 1-е место в рейтинге вузов России по качеству приёма (2024); 1-е место в рейтинге вузов по качеству подготовки специалистов в области искусственного интеллекта (2024). Работа в МФТИ это: работа в лучшем техническом вузе страны в команде с выдающимися учеными мирового уровня, талантливыми и мотивированными студентами и высококвалифицированными специалистами; непрерывный профессиональный рост во время работы над амбициозными задачами и уникальными проектами на стыке образования, науки и индустрии, возможность внести свой вклад в развитие образования и науки в России. Центр когнитивного моделирования Института ИИ МФТИ — одна из ведущих российских научно-инженерных групп в области робототехники, ИИ и когнитивных систем. Центр разрабатывает прикладные и исследовательские решения в сфере манипуляции, автономных робототехнических систем и управления сложными объектами. Результаты регулярно публикуются в ведущих журналах (Neurocomputing, RA-L, EAAI, IEEE Transactions on ITS и др.) и на международных конференциях (ICRA, IROS, CoRL, ICCV и т.д.). ЦКМ ищет специалиста для проекта, связанного с автоматизацией манипуляционных операций в сложной и вариативной среде, включающих работу с множеством объектов различной формы и свойств. Чем тебе предстоит заниматься: Разработка алгоритмов RL, в т.ч.: - проектирование, реализация и оптимизация алгоритмов обучения с подкреплением (PPO, SAC, TD3 и др.) - создание обучающих пайплайнов для online и offline RL: генерация траекторий, формирование и анализ Replay Buffer - разработка инструментов мониторинга экспериментов, анализа поведения политик и управления качеством данных. Работа с симуляцией (IsaacSim): - построение физически реалистичных симуляций объектов и манипуляторов, включая настройку параметров массы, трения, инерции, контактов - генерация обучающих данных с использованием домен-рандомизации и крупных наборов 3D-моделей. - разработка и интеграция кастомных симуляционных сред для RL-обучения. Работа с реальными роботами: - адаптация и отладка политик на реальном манипуляторе - дообучение моделей на реальных данных (Sim2Real adaptation) - анализ ошибок и повышение устойчивости поведения при переносе «симуляция-реальность». Интеграция управления: - реализация архитектуры «RL+классическое управление» (PID, MPC, LQR и др.) - интеграция компонентов в ROS-пайплайны и системные модули управления роботом. Инженерные задачи и разработка инструментов: - написание чистого, поддерживаемого кода (ООП, документация, тестирование) - участие в разработке архитектуры внутренних библиотек и инфраструктуры - оптимизация вычислительных пайплайнов, ускорение симуляционных циклов. Чего мы ждём от тебя: Обязательное наличие оконченного высшего технического образования. Уверенное владение языком Python, желательный опыт промышленной разработки Опыт работы с фреймворком PyTorch Наличие практического опыта разработки алгоритмов RL (PPO, SAC, TD3 и др.) Опыт подготовки данных для Offline RL Базовые навыки компьютерного зрения в задачах управления и манипуляции (работа с RGB/RGB-D, выделение объектов, простые модели восприятия) Понимание кинематики и динамики манипуляторов Опыт разработки собственных сред или сценариев в симуляции. Мы предлагаем: работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех); оформление в соответствии с ТК РФ; возможность бесплатного посещения бассейна и тренажерного зала; в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.Похожие вакансии
Исследователь-разработчик в DL/RL (дообучение LLM, RLHF, асинхронный RL)
От 165 300 до 216 500 руб.
Москва
МФТИ