Стек проекта Бэкенд:Python, FastAPI, SQLAlchemy, asyncpg, PostgreSQL, Alembic ML / AI:GUI-OWL (UI-TARS), GPT-5-mini, Claude (Anthropic Computer Use API), vLLM, OpenAI-совместимые API Агенты:собственные CUA-пайплайны (GUI-Owl, UI-TARS agent loop, Anthropic computer-use) Инфраструктура:Docker, Docker Compose, S3 (логи и скриншоты), VNC, управление виртуальными машинами через Docker API Обязанности: Развивать и оптимизировать CUA-агентов: повышать accuracy прохождения сценариев, уменьшать количество шагов, улучшать обработку edge-кейсов (капчи, нестандартные UI, динамический контент). Проектировать и внедрять новые агентные пайплайны (multi-agent, judge-based архитектуры). Работать с vision-language моделями (UI-TARS, Claude Vision): подбор, fine-tuning, prompt engineering, оценка качества. Интегрировать и деплоить LLM-сервисы (vLLM, OpenAI API, Anthropic API), оптимизировать инференс (tensor parallelism, batching). Участвовать в масштабировании системы: увеличение количества одновременно обрабатываемых задач, параллелизация задач, управление ресурсами виртуальных машин. Работать с данными: парсинг, структурирование результатов, интеграция с PostgreSQL и S3. Требования: Обязательно: Опыт работы с LLM в продакшн-окружении (prompt engineering, function calling, structured output). Опыт построения AI-агентов (LangChain / LangGraph / ReAct / Tools). Понимание архитектуры и принципов работы CUA / GUI-агентов (Anthropic Computer Use, UI-TARS или аналоги). Уверенное владение Python (asyncio, FastAPI или аналогичные фреймворки). Опыт работы с Docker (сборка образов, docker-compose, управление контейнерами). Умение читать и воспроизводить результаты ML-research (статьи, бенчмарки, open-source модели). Будет плюсом: Опыт деплоя и оптимизации LLM-инференса (vLLM, TGI, tensor parallelism). Опыт fine-tuning vision-language моделей. Знакомство с multi-agent системами и оркестрацией агентов. Опыт работы с Anthropic API (в т.ч. Computer Use). Понимание веб-автоматизации (Selenium, Playwright, pyautogui). Опыт работы с PostgreSQL, SQLAlchemy, Alembic. Условия: Работа над R&D-проектом в области AI-агентов и LLM-систем. Современный стек: Python, LLM-сервисы, vision-language модели, агентные архитектуры. Возможность работать с передовыми решениями в области Computer Use Agents. Удаленный формат работы из любого города или страны График работы 5/2 Отпуск - 28 календарных дней.
Похожие вакансии