Наша команда развивает ИИ-решения для автоматизации закупочных процессов: обработки заявок, коммерческих предложений, технических предложений, договоров, спецификаций, протоколов и сопутствующих документов. Ищем ML/LLM - инженера с практическим опытом в generative AI, который умеет быстро запускать и проверять модели, собирать прототипы и демо, а затем встраивать удачные решения в рабочие сервисы. Обязанности: Разработка ML/LLM-компонентов для закупочных процессов Разработка пайплайнов OCR/LLM-извлечения данных из PDF, DOCX, XLSX, сканов, писем и вложений. Формирование черновиков аналитических записок, протоколов сравнения, обоснований и итоговых материалов. Интеграция ML-компонентов в backend-сервисы через API. Прототипирование и запуск open-source моделей Запуск и адаптация моделей с GitHub, Hugging Face и других open-source источников. Создание рабочих ML/AI-прототипов и демо-стендов в короткие сроки. Проверка применимости новых моделей и подходов на реальных данных. Адаптация research/demo-кода под практические задачи. Создание демо-интерфейсов для бизнеса и внутренних пользователей. LLM, RAG и structured output Построение RAG/hybrid search по договорам, закупкам, КП, технической документации и справочникам. Разработка retrieval-логики, embeddings, rerank, chunking-стратегий и фильтрации по метаданным. Реализация structured output через LLM: JSON Schema, pydantic-схемы, function calling / tool calling. Валидация, нормализация и постобработка ответов модели. Настройка confidence score и правил обработки ошибок. Снижение галлюцинаций, невалидных JSON-ответов и неполных структурированных результатов. Backend и frontend Разработка backend-сервисов и frontend на Python (с Streamlit и Gradio) Реализация REST API и асинхронных пайплайнов обработки задач. Работа с FastAPI, pydantic, async/sync API. Работа с очередями и брокерами сообщений: Celery, Kafka, RabbitMQ или аналогами. Интеграция ML/LLM-компонентов с поиском, базами данных, файловыми хранилищами и пользовательскими интерфейсами Evaluation и контроль качества Разработка метрик качества ML/LLM-модулей и пайплайнов разметки/валидации. Оценка качества классификации (accuracy, precision, recall, F1), извлечения атрибутов (exact/partial match, полнота схем), RAG (precision, recall, MRR, nDCG, hit rate) и LLM-ответов (фактологичность, полнота, цитирование). Подготовка регрессионных наборов и эталонных примеров. Организация human-in-the-loop разметки и анализа ошибок. Проектирование сценариев, где модель предлагает результат, пользователь подтверждает или исправляет, а исправления сохраняются для дальнейшего улучшения системы. Generative AI и мультимодальные модели Запуск и адаптация генеративных моделей для текста, изображений и мультимодальных сценариев. Подбор моделей под конкретные прикладные задачи: извлечение информации, классификация, визуальный анализ, генерация, сравнение объектов. Требования: Уверенный навык Python, Streamlit и Gradio. Опыт разработки backend-сервисов на FastAPI или аналогичных фреймворках. Опыт работы с REST API, Docker, конфигурациями, секретами и CI/CD. Умение писать код, который можно сопровождать, отлаживать, тестировать и передавать. Опыт работы с очередями и асинхронной обработкой задач будет преимуществом. Желательно понимание async/sync API, pydantic, типизации, тестирования, логирования и обработки ошибок. LLM/RAG-практика Практический опыт разработки RAG-систем, понимание embeddings, rerank, chunking, hybrid search, grounding, prompt engineering. Опыт работы с tool calling / function calling и многошаговыми LLM-пайплайнами. Опыт получения structured output от LLM. Практика работы с JSON Schema, pydantic-моделями, structured output и валидацией результатов. Понимание типовых проблем LLM: галлюцинации, потеря контекста, невалидный JSON, неполные ответы, нестабильность результата. Умение оценивать качество LLM/RAG-пайплайнов не только визуально, но и через метрики и тестовые наборы. Быстрый запуск моделей и generative AI Практический опыт запуска open-source моделей с GitHub и Hugging Face, работа с PyTorch и Hugging Face Transformers, умение быстро разобраться с чужим research/demo-кодом. Понимание зависимостей ML-проектов, окружений, CUDA, GPU-инференса и типовых проблем запуска моделей; опыт создания быстрых демо на Gradio, Streamlit, FastAPI или аналогичных инструментах. Опыт работы с генеративными моделями — важное преимущество. Опыт с Stable Diffusion, SDXL, ControlNet, LoRA или аналогичными image generation подходами — преимущество. Понимание VQA, vision-language models и мультимодальных сценариев — преимущество. Поиск и базы данных Опыт работы с OpenSearch, Elasticsearch, PostgreSQL или аналогичными системами. Понимание полнотекстового, векторного и гибридного поиска; индексов, фильтров, справочников и метаданных. Опыт построения поиска по документам, чанкам, атрибутам и структурированным данным; trade-off между качеством поиска, скоростью, памятью и стоимостью индексации. Опыт работы с SQL и базовыми схемами хранения данных. ML evaluation Умение считать качество ML/LLM-компонентов. Понимание accuracy, precision, recall, F1 для классификации, precision/recall для извлечения сущностей и атрибутов, использование exact match и partial match для оценки структурированного извлечения. Оценка качества RAG-ответов: релевантность источников, фактологичность, полнота, корректность цитирования. Умение готовить тестовые выборки, эталонные примеры и регрессионные наборы. Понимание human-in-the-loop подхода к разметке, исправлению и улучшению качества. Информационное извлечение Опыт NER, классификации и нормализации сущностей; извлечение закупочных атрибутов (наименование МТР, количество, единицы, сроки, цена, валюта, технические параметры) и сопоставление со справочниками. Нормализация единиц, валют, дат, чисел и текстовых характеристик; правила валидации и проверки полноты данных. Понимание выбора подхода: классические алгоритмы, ML-классификация или LLM для разных задач.. Условия: Оформление по договору ГПХ , срочный договор до конца 2026 с возможностью продления по результатам. Гибкий формат работы. Конкурентная проектная ставка, прозрачная система приёмки этапов. Доступ к корпоративным ресурсам, современному стеку и техническому менторству. Возможность перехода на постоянную основу по итогам проекта.
Похожие вакансии
Разработчик машинного обучения (ML, LLM)
Договорная
Санкт-Петербург. Станции метро: Адмиралтейская
БИОКАД, биотехнологическая компания