Обязанности:
Мы развиваем корпоративную AI‑платформу в крупном банке, где инженеры строят LLM‑ и ML‑инференс на продакшн‑кластерах, RAG‑сервисы и инструменты для десятков внутренних команд. Это проект на стыке backend, DevOps и ML‑инженерии: много системного дизайна, высокие нагрузки, безопасный прод и реальное влияние на то, как бизнес использует ИИ каждый день. Чем предстоит заниматься: Technical ownership ключевых компонентов AI Platform (ML + GenAI): от архитектуры и бэклога до продакшена и метрик надежности. Проектирование и развитие core backend сервисов платформы: Model/LLM endpoint management (версии, маршрутизация, политики), usage metering / quotas / rate limits / cost controls, access control + audit services, integration layer для tool-calling / RAG / knowledge services. Разработка сервисов вокруг LLM/ML inference: единые API и контракты, безопасная интеграция с внутренними системами, контроль качества и наблюдаемость (latency, errors, cost, answer quality signals). Совместно с AISec/Compliance: внедрение guardrails и security controls: политики доступа к данным/моделям, PII/секреты, контентная фильтрация, защита от prompt injection, безопасные шаблоны интеграций. Построение и поддержка production-grade практик: CI/CD, тестирование (unit/integration/contract), релизы, rollback стратегии, performance и reliability (SLO/SLA), capacity planning, участие в on-call/разборе инцидентов, проведение postmortems. Создание “golden paths” для команд-потребителей платформы: reference implementations, шаблоны сервисов, библиотеки/SDK, документация и стандарты. Менторинг инженеров, развитие команды: техническое лидерство, подбор, проведение архитектурных ревью. Требования: Опыт backend-разработки 5+ лет, из них 2+ года в роли senior/tech lead/архитектора или с выраженным technical ownership. Опыт проектирования и развития platform services и/или внутренних продуктов (PaaS, data platform, API platform). Сильные навыки системного дизайна: SLA/SLO, мульти-тенантность, отказоустойчивость, деградация, идемпотентность, backpressure, rate limiting. Уверенная работа с API-first подходом: REST/gRPC, версионирование контрактов, backward compatibility, contract testing. Практический опыт построения secure-by-design сервисов: OAuth2/OIDC, RBAC/ABAC, mTLS, secrets management, audit trails, PII/конфиденциальные данные. Опыт эксплуатации высоконагруженных систем: profiling, performance tuning, capacity planning, incident response (postmortems). Умение выстраивать инженерные практики: code review, quality gates, CI/CD, документация, “golden paths”, шаблоны сервисов. Коммуникация со стейкхолдерами: перевод требований бизнеса/рисков в технические решения и контроль их выполнения.Похожие вакансии