Аккредитованная компания “АЦТС”, являющаяся дочерней IT структурой «Про.Потолок», приглашает в команду опытного ML/LLM инженера-разработчика (Document AI) уровня Senior / Lead для работы над масштабными и технологически сложными проектами в сфере цифровизации строительства. Мы создаем будущее строительной индустрии и ищем специалиста, который поможет нам реализовать наши амбициозные планы. Что мы предлагаем? Удаленный или гибридный формат работы – работайте из любой точки мира. Участие в уникальном проекте – цифровая платформа для строительной отрасли. Стабильный и прозрачный доход – 300 000 руб. - 350 000 руб. по результатам собеседования. Зависит от вашего опыта. Профессиональное развитие – работа с новейшими технологиями, сильной командой и участие в крупных проектах. Обязанности: Разработка алгоритмов парсинга и распознавания структуры сложных документов (Excel, PDF, CSV). Интеграция LLM/ML для автоматического распознавания данных, форм и статусов. Разработка RAG-моделей и агентов для обработки данных пользователя. Создание инфраструктуры для синхронизации данных между Excel и нашей системой в реальном времени. Работа с данными различной структуры и уровня сложности, обеспечение корректной логики автоматических изменений. Оптимизация производительности при работе с большими таблицами и сложными связями между данными. Базовые задачи: Автоматизация обработки пользовательских документов (Excel, PDF, CSV) с различной структурой и вложенностью. Парсинг и распознавание табличных данных, статусов и связей между ними. Обеспечение синхронизации данных между внешними системами (Excel, другие инструменты) и нашей платформой. Поддержка экспорта/импорта данных, перекрёстной проверки информации и отслеживания статусов. Обработка форм актов и отчетности (КС-2, промежуточные и дефектные акты, ведомости). Распознавание и автоматизация заполнения данных с использованием парсинга и LLM. Автоматизация согласования, отслеживания статусов и работы с метаданными. Требуемый стек и опыт (обязательно): Языки и технологии: Python 3.10+ (Pandas, NumPy, PyTorch/TensorFlow, OpenCV) C++17+ для высокопроизводительных компонентов Опыт разработки модулей ML и CV для структурированных и табличных данных ML/LLM / CV: Опыт работы с LLM для распознавания структуры документов Опыт построения и использования RAG-моделей, агентов, NLP для структурированных данных Опыт применения алгоритмов компьютерного зрения к таблицам, PDF и сложным Excel-документам. ДОПОЛНИТЕЛЬНО: Умение проектировать архитектуру автоматизированных процессов и потоков данных Хорошие аналитические и математические навыки Опыт работы с большими данными и сложными структурированными таблицами Опыт работы с Excel API / OpenPyXL / xlwings / Apache POI (Java) — плюс Требования к кандидату: Оконченное высшее профильное образование (обязательно); Подтвержденный опыт разработки от 5 лет; Глубокое понимание паттернов проектирования, алгоритмов и структур данных. Какими личными качествами должен обладать кандидат? Мы ищем разработчика, который: Системное мышление и умение разбивать сложные задачи на подзадачи Высокий аналитический уровень, внимательность к деталям Самоорганизован – умеет эффективно управлять своим временем и задачами. Ответственен – выполняет работу качественно и в срок. Внимателен к деталям – уделяет внимание качеству кода и архитектуры. Командный игрок – умеет взаимодействовать с коллегами и работать в связке с другими специалистами. Инициативен – предлагает идеи и решения для улучшения процессов. Адаптивен – быстро осваивает новые технологии и методологии разработки.
Похожие вакансии