CADSmith:基于程序化几何验证的多智能体CAD生成系统
在计算机辅助设计(CAD)领域,从自然语言描述自动生成精确的三维模型一直是AI研究的前沿挑战。传统方法要么采用单次生成缺乏几何验证,要么依赖有损的视觉反馈难以纠正尺寸误差。近日,卡内基梅隆大学的研究团队在arXiv上发布论文《CADSmith: Multi-Agent CAD Generation with Programmatic Geometric Validation》,提出了一种创新的多智能体管道,通过程序化几何验证实现高质量的文本到CAD生成。
核心架构:双循环迭代精炼
CADSmith的核心创新在于其双循环迭代精炼机制。系统首先将自然语言输入转换为CadQuery代码(一种基于Python的CAD脚本语言),然后进入两个嵌套的校正循环:
- 内循环:专注于解决代码执行错误,确保生成的程序能够无故障运行。
- 外循环:基于程序化几何验证,结合OpenCASCADE内核的精确测量(如边界框尺寸、体积、实体有效性)与独立视觉语言模型Judge的整体视觉评估。这种设计同时提供了数值精度和高层形状感知能力,使系统能够收敛到正确的几何结构。
技术优势:检索增强生成与动态更新
与依赖微调的模型不同,CADSmith采用**检索增强生成(RAG)**技术,从API文档中检索相关信息。这种方法允许系统在底层CAD库更新时保持数据库的时效性,无需重新训练模型,显著提升了适应性和维护效率。
性能评估:显著提升生成质量
研究团队在包含100个提示的自定义基准上进行了评估,提示分为三个难度等级(T1至T3),并设置了三种消融配置。与零样本基线相比,CADSmith表现出色:
- 执行率:从95%提升至100%,实现了完全可靠的代码生成。
- 几何精度:
- 中位数F1分数从0.9707提高到0.9846
- 中位数交并比(IoU)从0.8085跃升至0.9629
- 平均倒角距离(Chamfer Distance)从28.37大幅降低至0.74
这些数据表明,基于程序化几何反馈的闭环精炼显著提升了LLM生成CAD模型的质量和可靠性。
行业意义与应用前景
CADSmith的提出标志着AI在工程设计和制造自动化领域的重要进展。传统CAD生成方法往往受限于视觉反馈的模糊性,难以确保尺寸精度,而CADSmith通过程序化验证解决了这一痛点。该系统有望应用于:
- 快速原型设计:工程师通过自然语言描述即可获得精确的CAD模型,加速产品开发周期。
- 教育工具:帮助学生理解几何概念与CAD编程的关联。
- 自动化制造:为3D打印、CNC加工等提供可靠的数字模型来源。
未来展望
尽管CADSmith在实验中展现了卓越性能,但研究团队指出,系统目前仍依赖于特定的CAD库(CadQuery)和验证工具(OpenCASCADE)。未来工作可能探索更广泛的CAD格式支持,以及将类似框架应用于其他工程设计领域。随着多智能体系统和程序化验证技术的成熟,AI驱动的CAD生成有望成为工业4.0的关键赋能技术之一。


