LegoGPT 可以根据文本提示使用标准 LEGO 设计稳定的结构
2025-05-13 12:14
来源:卡内基梅隆大学
收藏

卡内基梅隆大学的工程师和人工智能专家团队开发了一款人工智能应用程序,该应用程序可以使用文本提示,利用标准乐高积木设计出稳定的结构。在发表于arXiv预印本服务器上的研究中,该团队重新利用了 META 创建的大型语言模型 (LLM) 来构建他们的新系统。

研究团队致力于改进3D生成模型,这些模型目前往往会因为重力或连接断开等问题,生成在现实世界中无法运行的设计。为此,他们转向了乐高积木——一种类似积木的塑料玩具,可以让孩子们发挥想象力来搭建各种结构。

为了构建他们的系统,团队首先从 META 的法学硕士(LLaMA-3.2-1B-Instruct)入手。为了用它来设计积木结构,他们将下一个单词预测替换为下一个积木预测。他们还添加了一个单独的基于数学的模块,通过考虑结构力和重力来确保物理稳定性。接下来,他们创建了一个包含 47,000 个稳定乐高结构和特征的训练数据集,并由另一个 AI 系统生成说明,然后用它来训练他们的 AI 模型。

为了创建设计,系统采用递归方法——先放置砖块,然后测试添加砖块是否会导致不稳定;如果会导致不稳定,则移除砖块并采用其他方法。研究人员在不使用回滚功能的情况下测试了他们的系统,发现只有 24% 的设计在现实世界中能够稳定构建;而使用回滚功能后,这一比例上升到了 98.8%。接下来,团队添加了颜色和纹理功能。

为了进一步测试他们的设计,研究人员使用了一对可以根据设计进行编程搭建乐高结构的机器人,并生成了几个测试结构。他们还手工制作了一些。

该团队表示,他们的系统能够生成各种稳定的乐高结构。他们还指出,他们已将该系统与其他用于创建3D对象的AI系统进行了测试,发现该系统生成的稳定结构比例更高。

更多信息: Ava Pun 等,《从文本生成物理稳定且可搭建的乐高设计》,arXiv (2025)。期刊信息: arXiv

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com