Обязанности:
Мы разрабатываем платформу для управления физической сетью Сбера. Ключевое направление — интеллектуальные сервисы на базе LLM и ML, которые обрабатывают структурированные данные, генерируют рекомендации и обеспечивают работу AI-агентов в продукте. Вам предстоит строить отказоустойчивые backend-решения, интегрировать модели в production и формировать стандарты работы с AI в команде.Задачи: проектировать и разрабатывать высокопроизводительные сервисы на Python FastAPI интегрировать LLM и ML-модели в продакшен, а именно: оркестрация AI-агентов, построение RAG-пайплайнов, управление контекстом, обработка потоковых ответов, оценка качества генерации работать с данными SQLAlchemy, проектировать схемы БД, оптимизировать запросы, кэширование, взаимодействие с векторными хранилищами разрабатывать и документировать API-контракты для фронтенда и внешних систем, обеспечение стабильности, безопасности и идемпотентности внедрять AI-инструменты в процесс разработки для генерации кода/тестов, автоматизации ревью, ускорения пайплайнов настраивать наблюдаемость через метрики, логи, трассировку и отлаживать production-инциденты вести кросс-функциональное взаимодействие в части совместной оптимизации пайплайнов данных, синхронизации с frontend по обработке AI-ответов и UX. Мы ждем от тебя: от 3 лет коммерческой разработки на Python, уверенное владение FastAPI, SQLAlchemy, асинхронным программированием (asyncio, httpx/aiohttp) коммерческий опыт интеграции LLM (OpenAI, Anthropic, open-source модели через vLLM/Ollama) и фреймворков (LangChain, LlamaIndex, Haystack или кастомные обёртки) понимание принципов работы ML-пайплайнов, опыт деплоя и масштабирования моделей/сервисов в production опыт проектирования REST/gRPC API, работа с брокерами сообщений (Kafka/RabbitMQ), кэшем (Redis), очередью задач (Celery/Dramatiq) активное использование AI-инструментов в разработке (Cursor, GitHub Copilot, LLM API) с пониманием, как встраивать их в CI/CD и рабочий процесс без потери качества кода умение самостоятельно разбираться в новых доменах, писать читаемый и тестируемый код, проводить конструктивные код-ревью Базовые знания Docker, CI/CD, принципов наблюдаемости и безопасности API. Будет плюсом опыт работы с векторными БД (Qdrant, Weaviate, Milvus, pgvector) и построения production-ready RAG-систем опыт работы в FinTech/Enterprise, понимание compliance-требований к данным и аудита изменений понимание ML-метрик, A/B тестирования AI-фич, методов валидации и редукции галлюцинаций LLM опыт настройки мониторинга, алертинга и cost-оптимизации для AI-сервисов (token usage, latency, fallback-схемы) опыт менторства/онбординга джунов, участие в формировании стандартов кодирования в команде. Мы предлагаем: комфортный современный офис на м.Кутузовская формат работы офис на время адаптации, далее гибрид ежегодный пересмотр зарплаты и годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.Похожие вакансии