Обязанности:
Ищем сильного разработчика с опытом работы с LLM и браузерной автоматизацией для создания MVP диалоговой AI-системы персонализированного общения.Задача: Развёртывание и интеграция self-hosted LLM (LLaMA) через vLLM или аналог Оптимизация инференса для real-time диалоговой системы Реализовать backend (чат, сессии, API) Настроить поведение модели и prompt engineering Проектирование архитектуры памяти и профилей пользователей (PostgreSQL / Redis, история диалогов, профиль пользователя) Браузерная автоматизация через Playwright с имитацией человеческого поведения (работа с прокси, подмена fingerprint) Telegram-бот для операционных уведомлений Интеграция всех компонентов системы в единый pipeline Быстро фиксить проблемы по результатам тестов Цель: запуск MVP за короткий срок, который можно тестировать в реальных диалогах Требования: Обязательно: Опыт работы с LLM (open-source модели) Понимание prompt engineering Опыт backend-разработки 3+года (Python) Опыт браузерной автоматизации (Playwright / Puppeteer) Понимание антидетект техник Понимание работы API, очередей, БД Умение быстро собирать MVP Плюсом будет: Опыт с vLLM / TGI / Ollama Работа с LLaMA / Qwen / Mistral Опыт с антидетект браузерами (Dolphin Anty / AdsPower) Опыт с LoRA / fine-tuning Понимание memory систем (RAG, embeddings) Опыт работы с high-load чатами Стек: Python (FastAPI) vLLM / HuggingFace Playwright PostgreSQL / Redis Docker Что важно Скорость > идеальность Самостоятельность, задачи формулируются на уровне продукта, не технического задания Участие в продуктовых обсуждениях и предложение технических решений Условия: Удалённая работа Проектное сотрудничество (ГПХ / самозанятый / ИП) Быстрый стартПохожие вакансии