Ищем ML Engineer для работы с мультимодальными моделями и развития антифрод-модуля Обязанности: OCR и модели Исследование, обучение и fine-tuning VLM-моделей (InternVL, Qwen-VL и др.) под задачи document understanding. Дообучение моделей (LoRA / Multi-LoRA) под специфику разных стран и языков. Подготовка данных: сбор, разметка, аугментация датасетов по гео. Оптимизация пайплайна инференса: квантование, batching, параллелизация. Антифрод Проектирование и разработка ML-модуля антифрода. Разработка методов выявления мошенничества. Разработка скоринговой модели подозрительности клиента (Supervised, Unsupervised подходы) с интеграцией в существующий OCR-пайплайн и callback API. Мониторинг и адаптация моделей к новым схемам мошенничества, анализ false positive / false negative. Участие в поддержке и развитии production-сервиса (API, мониторинг, деплой). Требования: Обязательно: ML / Deep Learning Опыт работы с PyTorch от 2 лет. Практический опыт обучения и fine-tuning моделей компьютерного зрения (классификация, детекция, OCR). Понимание архитектур трансформеров (Vision Transformer, encoder-decoder). Опыт работы с техниками parameter-efficient fine-tuning (LoRA, QLoRA). Умение проводить эксперименты, отслеживать метрики, сравнивать модели. Computer Vision / NLP Опыт работы с задачами OCR или document understanding. Понимание пайплайнов обработки изображений (детекция текста, распознавание, постобработка). Базовое понимание NLP-задач (извлечение сущностей, парсинг структурированных данных). Антифрод / Anomaly Detection Опыт или понимание задач anomaly detection / binary classification в условиях дисбаланса классов. Понимание метрик fraud-систем: precision/recall trade-off, стоимость ошибок первого и второго рода в контексте финансовых операций. Engineering Python: уверенное владение, умение писать чистый production-код. Опыт работы с GPU-инференсом (CUDA, управление VRAM, профилирование). Опыт работы с Docker (контейнеры, docker-compose). Linux: уверенная работа в терминале, SSH, базовое администрирование. Будет плюсом: Опыт работы с vLLM, SGlang или аналогичными inference-серверами. Опыт работы с мультимодальными моделями (VLM: LLaVA, InternVL, Qwen-VL). Опыт квантования моделей (GPTQ, AWQ, bitsandbytes). Практический опыт fraud detection в финтехе или платёжных системах. Опыт работы с image forensics / document forgery detection. Опыт работы с EasyOCR, PaddleOCR, Tesseract или аналогами. Опыт работы с LayoutLM / Document AI моделями. Опыт разработки REST API (FastAPI / Flask). Условия: Стек: Python, PyTorch, vLLM, Docker, NVIDIA A100. Работа с state-of-the-art моделями (InternVL2, Qwen3-VL, LayoutLMv2). Задачи на стыке research и production: от экспериментов с моделями до разработки антифрод-системы в реальной платёжной системе. Возможность влиять на архитектурные решения. Удаленный формат работы из любого города или страны График работы 5/2 Отпуск - 28 календарных дней.
Похожие вакансии
Lead ML Engineer (Computer Vision)
Договорная
Москва
Центральный банк Российской Федерации (Банк России)
Lead ML Engineer (Computer Vision)
Договорная
Москва
Центральный банк Российской Федерации (Банк России)