奥尔巴尼大学研究揭示人工智能体学习背后的分层几何原理
2026-02-02 09:52
来源:奥尔巴尼大学
收藏

奥尔巴尼大学一项新研究揭示了人工智能体学习背后的几何原理,表明人工智能系统组织信息的方式远比之前认为的复杂。这项题为“利用体积增长变换探索强化学习游戏的分层空间结构”的研究已发表在arXiv上,为理解人工智能如何处理信息提供了新视角。

“两枚硬币”游戏。(右图):用于训练智能体的网络架构

长期以来,科学家们认为神经网络将数据编码在被称为流形的平滑低维曲面上。然而,奥尔巴尼大学的研究人员发现,基于Transformer的强化学习模型并非如此,而是将其内部表征组织在分层空间中。这种几何结构由多个不同维度的互连区域构成,与近期大型语言模型的研究结果相呼应,暗示分层几何可能是现代人工智能系统的一个基本特征。研究团队通过追踪人工智能工作中的几何形状,发现模型感知环境的难易程度与几何维度集群有关。低维度状态通常出现在环境简单或智能体已决定行动时,而高维度状态则出现在环境复杂或智能体需要权衡多种行动时。

研究人员利用体积增长变换技术,发现该模型的几何模式违背了流形假设和纤维束假设等既有理论。智能体的许多内部表征跨越多个层级,形成了一个具有突变过渡的几何景观。这些变化通常与游戏中的重要时刻相吻合,如接近目标、遇到新障碍或暂停评估导航选项。正如文理学院数学与统计系副教授贾斯汀·库里所说:“这些维度上的跃变反映了不确定时刻,当模型感到困惑或正在探索各种选项时,几何形状会出现尖峰。”心理学系助理教授格雷戈里·考克斯也表示:“分层几何不仅仅是一个抽象概念,它为我们提供了一个新的视角,让我们了解机器和人脑如何表示复杂的信息。”

研究人员指出,监测几何复杂性有助于识别人工智能系统遇到的最困难时刻,为自适应训练方法提供可能,以增强模型在最困难之处的性能。这一发现为理解人工智能决策提供了新视角,也为未来人工智能技术的发展奠定了基础。

出版详情: 作者:Justin Curry等人,标题:《利用体积增长变换探索强化学习游戏的分层空间结构》,发表于:《arXiv》(2025)

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com