Обязанности:
Условия: График: 5/2, удаленно Работа в небольшой команде, быстрые решения без бюрократии Потолок в зп 180 на руки!!! Основные задачи: Создание и дообучение моделей для работы с изображениями, текстом и аудио Точечное дообучение LLM под специализированные задачи Разработка и развёртывание API для доступа к обученным агентам Оптимизация инференса новых и уже работающих связок Интеграция моделей в существующие микросервисы Технические требования: Уверенное знание Python (asyncio, typing, dataclasses); Опыт работы с PyTorch/Transformers/vLLM Опыт тонкой настройки и дообучения LLM Понимание принципов RAG, LoRA, QLoRA Навыки в обработке изображений и OCR/CV задачах (Tesseract, OpenCV, Yolo); Умение создавать REST API (FastAPI, Flask) Понимание основ работы контейнеров и взаимодействия микросервисов Опыт оптимизации на GPU (CUDA, TensorRT, bitsandbytes) и развертывания на multi-GPU серверах Опыт интеграции моделей в продакшн Преимущество: Опыт работы с SQL и NoSQL Опыт работы с Redis Опыт построения архитектуры приложений, как общей, так и отдельных сервисов Опыт работы с брокерами сообщений (RabbitMQ, Kafka) Знание других языков программированияПохожие вакансии