other

Tech Lead Python (GigaChat: RAG Developer)

Более недели назад

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 6 лет

Наша команда разрабатывает RAG-архитектуру для GigaChat (модель и сайт). Основные задачи, которые выполняет сервис RAG (Retrieval Augmented Generation): поиск релевантной информации: RAG осуществляет эффективный поиск и извлечение данных из внешних баз знаний, документов или других источников, которые могут содержать ответ на запрос пользователя. дополнение контекста: найденные данные добавляются к запросу, который затем передается генеративной языковой модели (LLM), чтобы обогатить и уточнить ответ. генерация точного и обоснованного ответа: на основе как внутреннего знания модели, так и извлеченной релевантной информации RAG создает ответ, который более точен и менее подвержен ошибочным или вымышленным фактам (галлюцинациям). актуализация данных: позволяет получать ответы на основе свежих и обновляемых данных без необходимости переобучения самой языковой модели. поддержка факточекинга и ссылок на источники: RAG может предоставлять ссылки на исходные документы или данные, подтверждающие ответ. использование в специализированных задачах: решение вопросов в узкоспециализированных областях, таких как техническая поддержка, юридическая консультация, HR, клиентский сервис и интернет-магазины, где важна точность и своевременность информации. снижение рисков ошибок и галлюцинаций: минимизация случаев, когда модель выдает ложные или неточные сведения. Обязанности проектировать архитектуру backend-сервисов и RAG-систем руководить разработкой ключевых компонентов на Python / FastAPI принимать технические решения по API, данным, очередям, интеграциям и RAG-пайплайнам оптимизировать производительность, надежность и стоимость backend- и LLM-компонентов развивать подходы к поиску: semantic search, hybrid search, reranking, metadata filtering обеспечивать качество кода, проводить code review и помогать junior/middle-разработчикам исследовать новые технологии в области LLM, RAG и backend-разработки. Требования 5+ лет коммерческого опыта backend-разработки, преимущественно на Python. глубокое знание Python, FastAPI, асинхронного программирования и архитектуры backend-сервисов. сильный опыт работы с PostgreSQL, Redis, Docker / Docker Compose. опыт работы с Qdrant или другими vector databases в production. глубокое понимание RAG: ingestion, chunking, embeddings, retrieval, reranking, generation, evaluation. опыт интеграции LLM API и понимание их ограничений: latency, cost, rate limits, hallucinations. опыт работы с Kafka в production-сценариях. опыт проектирования микросервисной архитектуры. умение писать поддерживаемый, тестируемый и расширяемый код. опыт технического лидерства, декомпозиции задач и code review. английский язык на уровне чтения технической документации. Условия возможность выбрать удобный формат работы: гибрид или офис комфортный современный офис рядом с м. Кутузовская ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека выгоднее до 7% для каждого сотрудника бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.

Показать контакты

Имя не указано

Пожаловаться ID: 154292051

Похожие вакансии

Tech Lead/Lead Developer

Договорная

Москва

ТРАНСКАПИТАЛБАНК

Senior Python/Vue developer (Tech Lead)

Договорная

Москва

impulse.guru

Python Tech Lead Рег.облако

Договорная

Москва

Рунити

Senior Python Tech Lead

От 250 000 руб.

Москва

RedLab

Tech Lead Java Developer

Договорная

Москва

Aston

Senior Python Developer / Team Lead Python Developer

Договорная

Москва

Лучи