Обязанности:
Мы ищем разработчика, который поможет нам автоматизировать создание качественных изображений. Ваша задача — построить систему пакетной обработки/генерации изображений. Что предстоит делать: развернуть и поддерживать локальную AI‑инфраструктуру для генерации изображений; настраивать и оптимизировать пайплайны на базе ComfyUI / Stable Diffusion / ControlNet / SDXL / Flux / SD3 для пакетной обработки изображений; обучать собственные чекпоинты и дорабатывать существующие модели под специфику продукта — чтобы сохранять форму объекта, получать чистый фон и единый стиль изображений; настраивать масштабирование (multi-worker / multi-GPU); экспериментировать с разными моделями генерации (SDXL, Flux, SD3 и др.), чтобы найти оптимальное соотношение качества и скорости; развивать DevOps‑pipeline для ML/LLM‑сервисов: настраивать CI/CD, управлять версиями моделей и конфигураций, обеспечивать безопасные релизы, проводить A/B‑тесты и быстрый rollback; настроить систему мониторинга нагрузки на GPU, времени генерации и ошибок (например, с помощью Prometheus + Grafana); организовать систему очередей задач генерации и балансировку нагрузки между узлами; взаимодействовать с бэкенд для интеграции ML‑решений в API‑сервисы (работа с FastAPI, очередями и кэшированием); использовать OpenCV и PIL/Pillow для предобработки входных изображений (вырезание фона, выравнивание, нормализация) и постобработки сгенерированных; оптимизировать скорость генерации с помощью TensorRT для ускорения инференса на GPU; организовать хранение исходных и сгенерированных изображений,а также чекпоинтов моделей в S3‑совместимых хранилищах. Чего мы ждём от вас: уверенные знания Python(asyncio, aiohttp/FastAPI), PyTorch; глубокий опыт работы с ComfyUI на продакшн‑уровне; хорошее понимание микросервисной архитектуры и event‑driven подхода; понимание принципов работы diffusion‑моделей и методов fine‑tuning; опыт обучения собственных чекпоинтов для моделей SDXL / SD 1.5 / Flux / SD3 или аналогичных; опыт самостоятельного обучения LoRA, DreamBooth, Textual Inversion; умение добиваться консистентности между разными генерациями (сохранять ключевые признаки объекта); опыт работы с инструментами управления композицией — ControlNet, IP‑Adapter, StyleAdapter; опыт использования OpenCV или PIL/Pillow для обработки изображений; знакомство с TensorRT или другими инструментами оптимизации инференса для ускорения генерации; опыт работы с S3‑совместимыми хранилищами; понимание принципов построения REST API и интеграции с бэкендом; опыт работы с PostgreSQL (оптимизация сложных запросов, проектирование схем); опыт развёртывания и поддержки локальной AI‑инфраструктуры, включая: работу с GPU‑серверами (NVIDIA, CUDA) и оптимизацию использования ресурсов; работу с Docker и Docker Compose; навыки оркестрации контейнеров (Kubernetes — будет плюсом); понимание принципов мониторинга ML‑систем (Prometheus, Grafana или аналоги); навыки работы с Redis (кэширование, сессии, очереди); опыт построения отказоустойчивых систем и организации резервного копирования. Что мы предлагаем: работа с высоконагруженной системой генерации изображений; возможность экспериментировать с самыми свежими моделями и архитектурами; минимум бюрократии — вы сможете сосредоточиться на решении интересных задач; шанс внести вклад в создание заметного и инновационного продукта.Похожие вакансии
От 200 000 до 250 000 руб.
Москва. Станции метро: Улица Академика Янгеля
Diamond Personnel R&C