唐德斯神经科学研究所研究员亚历山德罗·英格罗索(Alessandro Ingrosso)与意大利两家研究机构的同事携手,共同开发出一种全新的数学方法,用于预测神经网络中迁移学习的有效性。该研究成果已发表于《物理评论快报》杂志。

在人工智能领域,系统训练往往依赖于海量数据。然而,在某些应用场景中,如医疗领域,通过超声波诊断癌症时,由于缺乏足够的训练样本,神经网络难以得到正确训练。英格罗索解释道:“这会导致‘过度拟合’现象,即网络在新案例上的泛化能力受限,进而产生大量假阳性和假阴性结果。”
为应对这一挑战,研究人员聚焦于“迁移学习”技术,旨在将基于大型数据集训练的网络知识迁移至基于有限数据的新网络。英格罗索表示:“我们研究了迁移学习的最简模型,并为单隐藏层网络构建了数学理论。”
在理论构建过程中,研究人员创新性地结合了两种分析方法:近期开发的“核重正化”方法与自旋玻璃理论中的经典“Franz-Parisi”形式。这种组合使得研究人员能够直接处理真实数据集,而非依赖统计模型或近似值。英格罗索补充说:“我们的新方法能够直接且准确地预测目标网络在应用源网络知识时的数据概括有效性。”
这项研究为在数据稀缺的领域,如医疗诊断及其他专业应用中,有效训练人工智能系统提供了新的思路。
更多信息: Alessandro Ingrosso 等人,《比例极限下全连接网络中迁移学习的统计力学》,《物理评论快报》(2025 年)。期刊信息: 物理评论快报 、 arXiv















京公网安备 11010802043282号