other

LLM/RAG/AI Engineer (Middle, Giga B2B "Салют для Бизнеса")

9 марта 2026

З/П не указана

Город: Москва. Станции метро: Цветной бульвар, Сретенский бульвар, Трубная, Сухаревская

Салют для Бизнеса

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Мы - команда ООО "Салют для бизнеса", дочерняя организация Сбера, мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду. Обязанности: Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking) Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя Настраивать и оптимизировать векторный и гибридный поиск Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов Разрабатывать агентные системы с использованием инструментов и многошаговым планированием Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy) Контейнеризировать и деплоить решения на on-prem инфраструктуру Требования Опыт работы от 3х лет Опыт работы с AI инструментами: от года Опыт создания RAG-систем Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках LangChain, LlamaIndex LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch Hybrid search: BM25 + dense retrieval, reciprocal rank fusion Embedding-модели: e5, bge, multilingual-e5 Python, Git, Docker, docker-compose PostgreSQL, Redis Методы оценки: hit rate, RAGAS, human evaluation Способность объяснить принятые технические решения и их trade-offs Условия достойная заработная плата + годовой бонус сильная команда ДМС, с первого рабочего дня работа в аккредитованной IT компании льготная ипотека от Сбера локация: Москва, м. Цветной бульвар.

Показать контакты

Имя не указано

Пожаловаться ID: 151653081

Похожие вакансии

QA-engineer (Middle) (Giga B2B "Салют для Бизнеса")

Договорная

Москва. Станции метро: Цветной бульвар, Сретенский бульвар, Трубная, Сухаревская

Салют для Бизнеса

LLM/RAG/AI Engineer

От 300 000 до 500 000 руб.

Москва. Станции метро: Цветной бульвар, Сретенский бульвар, Трубная, Сухаревская

Котик Алексей Александрович

Дизайнер (Giga B2B "Салют для Бизнеса")

Договорная

Москва. Станции метро: Цветной бульвар, Сретенский бульвар, Трубная, Сухаревская

Салют для Бизнеса

CFO (Giga B2B "Салют для Бизнеса")

Договорная

Москва. Станции метро: Цветной бульвар, Сретенский бульвар, Трубная, Сухаревская

Салют для Бизнеса

Системный аналитик (Middle) (Giga B2B "Салют для Бизнеса")

Договорная

Москва. Станции метро: Цветной бульвар, Сретенский бульвар, Трубная, Сухаревская

Салют для Бизнеса

Senior/Middle Python (Giga B2B "Салют для Бизнеса")

Договорная

Москва. Станции метро: Цветной бульвар, Сретенский бульвар, Трубная, Сухаревская

Салют для Бизнеса