Обязанности:
Вместе с нами тебе предстоит: Разработка и развитие AI-агентов и AI-продуктов. Построение и улучшение RAG и ML-пайплайнов. Оптимизация latency, стабильности и стоимости inference. Внедрение мониторинга качества моделей и сервисов. Интеграция AI-компонентов в продуктовую архитектуру. Участие в развитии AI-платформы и инженерных практик. Какие навыки и знания для нас важны: Коммерческий опыт fullstack-разработки от 5+ лет, из них 2+ лет с активным применением AI (LLM/ML). Практический опыт разработки и вывода в прод AI-агентов или AI-продуктов. Понимание архитектуры LLM-приложений (RAG, embeddings, orchestration, tools). Опыт работы с ML/NLP-пайплайнами в продакшене. Навыки оптимизации latency и стабильности AI-сервисов. Уверенные знания backend и frontend разработки. Работа с multi-agent системами или сложными агентными пайплайнами. Опыт оптимизации стоимости inference (token usage, caching, batching). Знание MLOps-практик и CI/CD для ML. Опыт построения AI-платформ или внутренних AI-инфраструктур. Глубокое понимание RAG (retrieval quality, chunking, reranking, evaluation). Опыт мониторинга качества моделей (offline/online метрики, A/B). Опыт управления коллективом-обязателен от 1 года. Требования к личным качествам: Инженерное мышление и ориентация на результат. Проактивность в улучшении архитектуры и процессов. Готовность брать ownership за продуктовые куски. Умение работать в неопределенности и быстро проверять гипотезы. Коммуникабельность и способность объяснять сложные вещи просто. Интерес к новым AI-подходам и инструментам. Знание иностранного языка (уровень): не ниже B1. Знание стека: Backend: Python (FastAPI), Node.js (NestJS/Express). Frontend: React / Next.js. LLM-стек: open-source модели, LangChain/аналоги. Базы данных: PostgreSQL, Redis. Инфраструктура: Docker, Kubernetes, облака. Профессиональные навыки: Проектирование и разработка AI-агентов и LLM-приложений. Построение и оптимизация RAG-пайплайнов. Интеграция LLM с внешними сервисами и API. Оптимизация производительности (latency, throughput, cost). Настройка мониторинга и оценки качества моделей. Участие в архитектурных решениях и развитии платформы. Специализированные программы: LangChain или аналоги. OpenAI API / HuggingFace / vLLM. Postman, Swagger. Prometheus, Grafana (или аналоги для мониторинга). GitHub / GitLab CI/CD. Airflow.Похожие вакансии
Fullstack разработчик (fullstack developer)
От 100 000 до 100 000 руб.
Екатеринбург
Концерн Уралэлектроремонт