Разработчик ML/LLM

Более недели назад

З/П не указана

Город: Москва. Станции метро: Улица Академика Янгеля

Ри-Адванс

Город: Москва. Станции метро: Улица Академика Янгеля

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Ри-Адванс

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Обязанности:

Мы ищем разработчика, который поможет нам автоматизировать создание качественных изображений. Ваша задача — построить систему пакетной обработки/генерации изображений. Что предстоит делать: развернуть и поддерживать локальную AI‑инфраструктуру для генерации изображений; настраивать и оптимизировать пайплайны на базе ComfyUI / Stable Diffusion / ControlNet / SDXL / Flux / SD3 для пакетной обработки изображений; обучать собственные чекпоинты и дорабатывать существующие модели под специфику продукта — чтобы сохранять форму объекта, получать чистый фон и единый стиль изображений; настраивать масштабирование (multi-worker / multi-GPU); экспериментировать с разными моделями генерации (SDXL, Flux, SD3 и др.), чтобы найти оптимальное соотношение качества и скорости; развивать DevOps‑pipeline для ML/LLM‑сервисов: настраивать CI/CD, управлять версиями моделей и конфигураций, обеспечивать безопасные релизы, проводить A/B‑тесты и быстрый rollback; настроить систему мониторинга нагрузки на GPU, времени генерации и ошибок (например, с помощью Prometheus + Grafana); организовать систему очередей задач генерации и балансировку нагрузки между узлами; взаимодействовать с бэкенд для интеграции ML‑решений в API‑сервисы (работа с FastAPI, очередями и кэшированием); использовать OpenCV и PIL/Pillow для предобработки входных изображений (вырезание фона, выравнивание, нормализация) и постобработки сгенерированных; оптимизировать скорость генерации с помощью TensorRT для ускорения инференса на GPU; организовать хранение исходных и сгенерированных изображений,а также чекпоинтов моделей в S3‑совместимых хранилищах. Чего мы ждём от вас: уверенные знания Python(asyncio, aiohttp/FastAPI), PyTorch; глубокий опыт работы с ComfyUI на продакшн‑уровне; хорошее понимание микросервисной архитектуры и event‑driven подхода; понимание принципов работы diffusion‑моделей и методов fine‑tuning; опыт обучения собственных чекпоинтов для моделей SDXL / SD 1.5 / Flux / SD3 или аналогичных; опыт самостоятельного обучения LoRA, DreamBooth, Textual Inversion; умение добиваться консистентности между разными генерациями (сохранять ключевые признаки объекта); опыт работы с инструментами управления композицией — ControlNet, IP‑Adapter, StyleAdapter; опыт использования OpenCV или PIL/Pillow для обработки изображений; знакомство с TensorRT или другими инструментами оптимизации инференса для ускорения генерации; опыт работы с S3‑совместимыми хранилищами; понимание принципов построения REST API и интеграции с бэкендом; опыт работы с PostgreSQL (оптимизация сложных запросов, проектирование схем); опыт развёртывания и поддержки локальной AI‑инфраструктуры, включая: работу с GPU‑серверами (NVIDIA, CUDA) и оптимизацию использования ресурсов; работу с Docker и Docker Compose; навыки оркестрации контейнеров (Kubernetes — будет плюсом); понимание принципов мониторинга ML‑систем (Prometheus, Grafana или аналоги); навыки работы с Redis (кэширование, сессии, очереди); опыт построения отказоустойчивых систем и организации резервного копирования. Что мы предлагаем: работа с высоконагруженной системой генерации изображений; возможность экспериментировать с самыми свежими моделями и архитектурами; минимум бюрократии — вы сможете сосредоточиться на решении интересных задач; шанс внести вклад в создание заметного и инновационного продукта.

Показать контакты

Контакт:

Имя не указано

При звонке сообщите, что Вы нашли вакансию на Rabix.ru

Откликнуться

Разместить Резюме

Распечатать Пожаловаться ID: 152841707