Обязанности:
О проекте: Строим AI-систему персонализированного общения. Нужен человек который умеет работать с LLM, проектировать сложную логику на уровне продукта и координировать небольшую команду разработчиков. Задачи: Проектирование общей архитектуры системы Декомпозиция задач для команды и контроль интеграции всех компонентов Развёртывание и интеграция self-hosted LLM (LLaMA) через vLLM или аналог Prompt engineering - настройка поведения модели, адаптация сообщений под профиль пользователя Перевод и адаптация сообщений в real-time Проектирование архитектуры памяти и профилей пользователей (PostgreSQL / Redis) API между frontend и backend (WebSocket для real-time) Техническая точка входа для продакта Требования: Обязательно: Python 3+ года Опыт технического лидерства на проектах обязателен Опыт работы с LLM (open-source модели) обязателен Prompt engineering обязателен PostgreSQL / Redis FastAPI + WebSocket Умение объяснять технические решения на уровне продукта Самостоятельность - задачи формулируются на уровне продукта, не технического задания Плюсом: Опыт с vLLM / Ollama / TGI Работа с LLaMA / Qwen / Mistral RAG, embeddings, memory системы High-load чаты Стек: Python (FastAPI) vLLM / HuggingFace PostgreSQL / Redis Docker WebSocket Условия: Удалённо Проектное сотрудничество с возможностью перехода в долгосрочную работу Быстрый старт В отклике укажите: Ссылки на проекты где работали с LLM Ссылки на проекты где проектировали архитектуру GitHub (если есть)Похожие вакансии