other

AI Engineer – RAG / Knowledge Graph / Local LLM

1 июня 2026

От 180 000 до 250 000 руб.

Город: Москва. Станции метро: Баковка, Немчиновка, Солнечная, Переделкино

LumosIT

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности:

О нас LumosIT - пять лет на рынке IT-разработки для бизнеса, резидент Технопарка Сколково, резидент Московского Инновационного Кластера, патенты на изобретения в области передовых методов AI. Строим корпоративные AI-системы для B2B: от строительства и производства до банков и логистики. Ядро нового продукта - интеллектуальные базы знаний, которые отвечают на основе внутренней документации компании без галлюцинаций и с трассировкой до источника. Заказов становится больше, проекты идут параллельно, поэтому расширяем команду инженером, для которого RAG это основная специализация. Чем предстоит заниматься Проектировать и строить RAG-пайплайны под нестандартные источники: транскрипты, живая речь, методологические материалы Строить Knowledge Graph поверх векторной базы - типология связей, смысловые цепочки, интеграция с retrieval в лучших традициях Карпати Разворачивать LLM семейства Qwen локально, настраивать OpenAI-совместимый API поверх Работать с Qdrant: payload-фильтрация, гибридный поиск, мультиарендная архитектура Задачи повторяются от проекта к проекту, устойчивый поток работы. Требования Опыт в Python и ML от 5-6 лет. С RAG-системами от 2-3 лет - с того момента, когда это стало актуальной инженерной задачей. Гибридный поиск (dense + sparse/BM25) - строил, понимаешь ограничения семантики Qdrant или аналог (Weaviate, Milvus) - работал в продакшне, не на пет-проектах Knowledge Graph - ребра с типологией, граф-обход, связка с векторным поиском Локальный деплой: llama.cpp, vLLM или Ollama, квантизация, CUDA LangGraph или LangChain - многошаговые агенты с состоянием, обработка ошибок, retry Русскоязычные данные - знаешь специфику токенизации, умеешь выбирать embedding-модель под задачу Стек: Python 3.10+, FastAPI, asyncio · LangGraph · Qdrant + pgvector · PostgreSQL / SQLAlchemy async · sentence-transformers, multilingual-e5-large · NetworkX · llama.cpp / vLLM · Docker, Linux · Git Плюсом: опыт с RAGAS / DeepEval, Neo4j, неструктурированными источниками, LoRA fine-tuning на RU-данных. Условия Работа удаленная. При желании - рабочее место в Технопарке Сколково. Работа напрямую с основателем компании без лишних звеньев. Договор с самозанятым или ИП. Оформление по ТК обсуждается. Зарплата: 180 000 - 260 000 руб., финальная цифра по итогам разговора. Вводный период 1-2 недели, оплачивается. Небольшое тестовое задание на 1-2 часа на этапе отбора.

Показать контакты

Имя не указано

Пожаловаться ID: 154667447