СиСофт Разработка - ведущий разработчик программного обеспечения для рынка САПР в области машиностроения, промышленного и гражданского строительства, архитектурного проектирования, землеустройства, электронного документооборота, обработки сканированных чертежей, векторизации и гибридного редактирования. Компания входит в реестр производителей отечественного ПО со всеми вытекающими преимуществами. Мы формируем направление AI / NLP для работы с инженерными и проектными данными и ищем Инженера машинного обучения (NLP / LLM / RAG). Обязанности: Разработка и внедрение систем интеллектуального поиска и извлечения информации из инженерной документации (PDF, DOCX, CAD-экспорты, спецификации, проектная документация); Построение и развитие RAG-систем (Retrieval-Augmented Generation) для работы с техническими знаниями и нормативной документацией; Разработка пайплайнов обработки документов: парсинг, структурирование, чанкинг, построение эмбеддингов, индексирование (vector DB); Настройка и дообучение LLM (LoRA, instruction-tuning) под задачи инженерного домена; Построение систем семантического поиска, QA, автоматического анализа и суммаризации проектной и нормативной документации; Разработка сервисов на FastAPI / REST API для интеграции ML-моделей в CAD-системы; Оптимизация инференса LLM (квантование, batching, GPU-инференс); Интеграция решений в серверную инфраструктуру (Docker, CI/CD); Разработка методик и стандартов эксплуатации ML-моделей; Участие в пилотных проектах с подключением AI-функциональности к CAD через API и плагины. Обязательные требования: Высшее техническое или математическое образование; Опыт разработки ML/NLP решений от 2 лет; Уверенное владение Python (production-level код); Опыт работы с: PyTorch / Transformers (HuggingFace), LLM (LLaMA, Mistral, Qwen и др.), Sentence Transformers / эмбеддинги; Опыт построения RAG-систем; Понимание архитектуры: vector databases (Qdrant, Milvus, FAISS), embedding pipelines, retrieval + reranking; Опыт извлечения информации из документов (OCR, layout parsing, таблицы, структуры); Навыки работы с Docker, Git; Опыт использования MLFlow, Weights & Biases или аналогичных систем; Умение документировать архитектуру и решения. Будет преимуществом: Опыт работы с инженерной или нормативной документацией; Знание форматов CAD (DWG, IFC, Revit-экспорт); Опыт работы с Docling, LangChain, LlamaIndex; Опыт оптимизации LLM (quantization, llama.cpp, vLLM); Понимание принципов MLOps; Опыт внедрения on-premise решений. Условия: Работа в стабильной, динамично развивающейся, аккредитованной ИТ-компании; Участие в проекте создания отечественной платформы AI-визуализации для архитектуры и инженерных систем; Работа в междисциплинарной команде (ML, CAD, DevOps, дизайн); Возможность профессионального роста и участия в R&D-проекте; Официальная заработная плата, обсуждается на собеседовании; Оформление по ТК РФ с первого рабочего дня; Медицинский полис ДМС расширенного формата за счет компании. Льготные условия оформления ДМС для членов семьи; Интересные задачи и коллектив профессионалов; Возможность карьерного роста; Возможность удаленной работы; Дружный коллектив; Комфортабельные офисы в г. Москва, г. Иваново, г. Нижний Новгород, г. Обнинск.
Похожие вакансии