Обязанности:
MWS AI – это часть экосистемы МТС Web Services, где создаются AI-решения будущего. Здесь мы разрабатываем современные AI-решения для различных сфер: от банковской до медицины и телекома. Мы стремимся к инновациям в области речевого ИИ, видеоаналитики и Gen AI: активно занимаемся исследованиями и публикуем научные статьи. В MWS AI вы найдете профессиональное сообщество единомышленников и возможности для реализации прорывных проектов. Мы ищем опытного AI-инженера, который сможет превратить сложные бизнес-задачи в работающие, масштабируемые AI-решения. Фокус на решении реальных бизнес-проблем, а не на исследованиях. Нам важно стратегическое мышление: умение быстро собирать PoC, валидировать их на метриках и итеративно доводить MVP до продакшена Основные задачи: Анализ и декомпозиция бизнес-задач Проектирование архитектуры AI-решений совместно с командой: выбор подходящих паттернов Внедрение метрик качества (точность, релевантность, время ответа), регулярный анализ результатов, формулирование гипотез, итеративное улучшение решения Разработка AI-агентов и copilot-систем (оркестрация агентов, управление памятью, планирование и декомпозиция задач, умная маршрутизация) Построение RAG-систем: выбор стратегий индексации, определение оптимального чанкинга, обогащение метаданными, реализация гибридного поиска и переранжирования Версионирование промтов, моделей, датасетов Внедрение наблюдаемости (observability) решений: трейсинг цепочек вызовов, мониторинг качества ответов, контроль затрат токенов и времени ответа Взаимодействие с командой разнонаправленных специалистов (backend/devops/ml/promt-engineer) Мы ждем от вас: 3+ лет прикладной AI/ML-разработки с фокусом на NLP и LLM-системы Опыт с LLM API: промпт-инжиниринг, управление контекстом, streaming Практический опыт с LLM-агентами: ReAct-паттерн, function calling, chain-of-thought рассуждения, multi-agent системы Обязательное знание LangFlow, n8n или аналоги Глубокое понимание RAG: векторный и гибридный поиск, стратегии чанкинга, переранжирование Сильный Python: чистый, типизированный код, unit-тесты, асинхронное программирование, ооп, docker Знание фреймворков: LangChain, LangGraph, CrewAI или аналоги Векторные базы данных: Milvus, Chroma или аналоги LLM observability tools: LangFuse или подобные платформы Понимание микросервисной архитектуры Опыт с FastAPI или аналогами Способность объяснить сложные AI-концепции нетехническим стейкхолдерам Будет преимуществом опыт fine-tuning и дистилляции моделей, а также понимание современных архитектур сетей Практический опыт с семействами Qwen, GLM, DeepSeek и аналогами Понимание принципов развёртывания LLM: инференс-серверы (vLLM, sglang), масштабирование, квантизация, GPU trade-offs Что мы предлагаем: 5/2, частичная или полная удаленка, гибкое начало дня. Оклад + квартальные и годовые бонусы. Комфортный офис в 10 минутах пешком от метро Курская. ДМС со стоматологией, страхование при поездках за рубеж, страхование жизни. Участие в конференциях и митапах, обучение за счет компании. Бесплатная мобильная связь. Специальные предложения от партнеров и друзей МТС.Похожие вакансии