美国研究人员提出热力学计算架构,AI能耗降至万分之一
2026-07-04 11:31
收藏

维度网讯,针对人工智能对高耗能数据中心的巨大需求,Extropic Corp.和麻省理工学院(Massachusetts Institute of Technology)的研究人员(包括量子信息科学家Isaac Chuang)提出一种去噪热力学计算机架构(Denoising Thermodynamic Computer Architecture, DTCA),宣称能以传统硬件极小一部分能耗执行特定AI任务。相关成果发表于《npj非传统计算》(npj Unconventional Computing)。

该研究旨在应对AI行业的核心挑战。团队指出,大规模AI系统的投资正给全球能源基础设施带来巨大压力,预计到2030年,以AI为重点的数据中心可能消耗美国总能源约10%。传统GPU(图形处理器)架构效率提升有限,而AI算法本身可能受现有硬件限制,因此寻找不同计算路径成为关键。

该提案设计了一种基于传统CMOS晶体管的概率计算机架构,利用受控随机性直接在硬件中执行概率计算。其原理借鉴扩散模型概念,将复杂概率建模任务分解为一系列简单去噪步骤,逐步将随机噪声转换为结构化数据,规避了先前概率硬件在“混合-表达力权衡”上的限制。硬件核心是专门设计的晶体管电路,用于生成可编程随机数,这些随机比特构成芯片上概率计算的基础,并通过模块化阵列实现多个串联的稀疏玻尔兹曼机。该模块化设计可通过单芯片上的多个专用硬件块实现,或由多个相互通信的芯片执行计算的不同阶段。团队已制造并测试了基于晶体管的实验性随机数发生器,在模拟的制造工艺变化下表现稳健。

为验证性能,研究人员通过GPU模拟了该架构,并纳入物理随机数发生器的实测数据。在Fashion-MNIST图像数据集上的基准测试显示,该架构生成的图像质量可与GPU实现相媲美,但能耗估计仅为后者每个生成样本的万分之一。此外,一种结合传统神经网络与热力学硬件的混合方法在CIFAR-10数据集上展现出潜力,其使用的神经网络参数数量仅为传统生成对抗网络的十分之一,有望更实用地在不同子系统间分配计算任务。

尽管结果令人鼓舞,研究团队指出了局限性。目前仅基于晶体管的随机数发生器经过物理验证,完整计算架构仍处于理论模拟阶段。基准测试所用的图像数据集远不如现代大型语言模型或先进生成模型复杂。如何高效地将系统扩展到处理更复杂数据,仍是概率计算面临的核心挑战。团队认为,未来进展更可能依赖于概率硬件与传统神经网络的深度集成,而非完全取代现有AI加速器。该研究应被视为值得进一步投资和探索的“第一步”。

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com