Обязанности:
Привет! 👋Мы — команда, которая разрабатывает корпоративных AI-агентов и RAG-системы для умного поиска по внутренней документации. Часть наших решений уже в эксплуатации, часть — в активной разработке.Сейчас мы ищем специалиста, который займётся качественной составляющей наших систем. Твоя задача — повышать качество RAG, выстраивать методологию оценки, тестирования, защиты, а также заниматься промпт-инжинирингом.Важно: это прикладная позиция — мы не обучаем модели, а используем готовые через корпоративный шлюз. Так что весь фокус на инжиниринг, оценку и тонкую настройку поведения агентов.Если тебя драйвит делать AI-решения надёжными, измеримыми и полезными — добро пожаловать в команду! ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: - Повышение качества RAG-агентов на трёх направлениях: поиск потехнической документации, по нормативной базе, по бухгалтерскойдокументации; - Промпт-инжиниринг и контекст-инжиниринг для всех агентов команды; - Подготовка эталонных наборов оценки качества; - Реализация LLM-as-a-judge как методологии автоматическихрегрессионных проверок; - Настройка защит (guards) для production-агентов: фильтры отинъекций в промпт, валидация структуры и контента выходов,защита от утечек ПДн, anti-hallucination механизмы; - A/B-тестирование промптов и моделей для подбора лучших конфигураций; - Тюнинг качества по сигналам обратной связи пользователей итрассировкам из Langfuse. Требования: - Python от 2 лет коммерческой разработки; - Практический опыт RAG-систем в продакшене: эмбеддинги, векторныебазы (Qdrant, FAISS или pgvector), переранжирование, чанкинг.Опыт построения и поддержки как минимум одного RAG-решения отначала до конца, не прототип; - Практический опыт оценки качества LLM-систем: подготовка эталонныхнаборов, offline-метрики, LLM-as-judge, регрессионные проверки.Опыт работы с фреймворками оценки (Ragas, DeepEval или аналоги); - Практический опыт настройки защит для LLM-приложений: защита отинъекций в промпт, валидация структуры и контента выходов,защита от утечек персональных данных; - Опыт промпт-инжиниринга и контекст-инжиниринга в реальныхпроектах: итеративная настройка промптов, structured output,function calling; - Понимание архитектуры RAG: стратегии нарезки документов, метаданные,выбор моделей эмбеддингов, переранжирование, точность ссылок наисточник; - Практический опыт работы хотя бы с одним LLM-фреймворком:LangChain, LangGraph, PydanticAI, OpenAI API или аналоги; - Практический опыт A/B-тестирования промптов и моделей в продакшене; - Опыт работы с агентскими протоколами (MCP) или собственнымtool-layer для агентов; - SQL и работа с реляционными базами на базовом уровне.Похожие вакансии
От 200 000 до 250 000 руб.
Москва. Станции метро: Кутузовская, Студенческая
Группа компаний Экзон
Договорная
Москва. Станции метро: Кутузовская, Студенческая
HAAS PLATFORM
От 5 000 до 7 000 руб.
Москва. Станции метро: Кутузовская, Студенческая
Simplenight