Обязанности:
В связи с расширением и вводом новых должностей РНИМУ им. Пирогова требуется AI‑инженер, LLM‑инженер (RAG, Agents, Python). О вакансииРНИМУ развивает собственную AI-платформу для задач образования, науки и внутренних цифровых сервисов университета. Ищем AI/LLM-инженера для развития интеллектуального слоя платформы.Вам предстоит развивать RAG-контур и системы работы со знаниями: построение retrieval-пайплайнов, интеграцию LLM с внутренними сервисами, разработку агентных сценариев и механизмов формирования ответов с опорой на источники.Архитектура платформы строится вокруг оркестрации запросов: LLM используется как компонент системы, взаимодействующий с RAG-контуром, инструментальными сервисами и внутренними данными. Ключевая задача — построение воспроизводимых и контролируемых интеллектуальных сценариев, работающих в условиях ограничений и нестабильности моделей.Работа ведется в существующем AI-контуре (Kubernetes, Kubeflow, MLflow, vLLM, MinIO, GPU-кластер, NVIDIA GPU Operator, Volcano) с разделением на окружения разработки, тестирования и промышленной эксплуатации. Задачи• Разработка и развитие RAG-контура платформы• Построение пайплайнов обработки данных: загрузка, предобработка, разбиение, индексация и поиск• Разработка и оптимизация retrieval-логики: переранжирование, гибридный поиск, уточнение запросов• Разработка агентных сценариев: управление tool calling, контроль выполнения и взаимодействие с внешними сервисами• Интеграция LLM-моделей и inference-сервисов в прикладные системы• Построение механизмов формирования ответов с опорой на источники (grounding, цитирование, проверка)• Разработка и поддержка контуров оценки качества: тестовые наборы, сценарии, метрики• Анализ и улучшение качества ответов на реальных данных• Работа с корпоративными документами и неструктурированными источниками данных Требования• Уверенное владение Python• Коммерческий опыт разработки от 4 лет• Практический опыт работы с LLM, RAG и retrieval-системами• Понимание полного цикла RAG: загрузка данных, предобработка, разбиение, эмбеддинги, индексация, поиск, переранжирование, оценка• Опыт работы с векторным поиском или поисковыми пайплайнами• Опыт улучшения качества поиска и ответов в production-системах• Понимание ограничений LLM: задержки, нестабильность, галлюцинации, ограничение контекста• Опыт интеграции LLM в backend-системы• Опыт разработки агентных сценариев или систем с tool calling• Опыт построения и использования метрик качества (offline/online evaluation)• Умение оценивать и улучшать систему на основе данных• Опыт работы с неструктурированными и “грязными” данными Будет плюсом• Опыт работы с LangChain, LangGraph или аналогичными фреймворками• Опыт построения гибридного поиска (vector + keyword)• Опыт работы с rerank-моделями и query rewriting• Опыт работы с локальными моделями и inference-серверами (vLLM, TGI, KServe и др.)• Опыт построения production RAG-систем• Опыт работы с корпоративными базами знаний• Опыт работы в ML/AI-инфраструктуре• Понимание MLOps и model serving на уровне интеграции Что важно для нас• Системное понимание LLM и RAG как части архитектуры, а не набора инструментов• Умение строить воспроизводимые, проверяемые и управляемые решения• Умение работать с качеством: находить проблемы и улучшать систему на основе данных• Умение принимать инженерные решения и нести за них ответственность• Критическое мышление: понимание, где нужен агент, а где достаточно корректно спроектированного retrievalПохожие вакансии
Инженер AI/LLM (RAG / pgvector)
Договорная
Москва. Станции метро: Юго-Западная, Коньково
Лига Цифровой Экономики
Senior ML Engineer (LLM, RAG, Agents)
Договорная
Москва. Станции метро: Юго-Западная, Коньково
Газпромбанк