Обязанности: Разработка и развитие RAG-систем Интеграция LLM через API (OpenAI, open-source модели и др.) Построение пайплайнов обработки данных и контекста Работа с MCP (Model Context Protocol) и инструментами вокруг него Разработка backend-сервисов на Python для AI-фич Интеграция векторных баз данных (поиск, индексация, оптимизация) Оркестрация агентов и инструментов (tool use, function calling) Оптимизация latency, стоимости и качества ответов моделей Мониторинг и логирование AI-систем. Требования: Уверенный Python (backend / сервисы) Опыт построения или использования RAG-систем Понимание работы LLM (prompting, контекст, токены, ограничения) Опыт работы с API моделей Знание одной или нескольких векторных БД (Qdrant, Weaviate, FAISS и др.) Опыт работы с Docker, K8S Опыт с MCP или похожими протоколами LangChain / LlamaIndex или аналогичные фреймворки Опыт построения AI-агентов Работа с потоками данных (Kafka, очереди).
Похожие вакансии