在机器学习领域,对称数据的处理一直是挑战,因为传统模型可能无法准确识别旋转或变换后的同一物体。麻省理工学院研究人员的一项新研究,针对机器学习对称数据处理提出了创新方法。该研究提出了一种在计算量和所需数据量方面均被证明有效的机器学习方法,这一方法首次确保了模型在处理对称数据时的准确性。

对称数据在自然科学和物理学中广泛存在,例如分子结构或图像中的物体位置变化。传统机器学习模型在面对这些数据时,可能因无法识别其对称性而降低准确性。麻省理工学院研究团队通过理论评估,探索了对称数据机器学习中统计与计算之间的权衡,并设计了一种有效算法。该算法借鉴了代数和几何学的思想,将两者结合成一个优化问题,从而简化了对称数据的处理过程。研究共同主要作者Behrooz Tahmasebi表示:“我们现在已经证明,利用对称数据进行机器学习是可行的。”这一算法不仅减少了训练所需的数据样本量,还提高了模型的准确性和适应新应用的能力。
该研究不仅为基础问题提供了答案,还为开发更强大的机器学习模型开辟了新途径。这些模型将广泛应用于新材料发现、天文异常识别以及复杂气候模式揭示等领域。研究共同第一作者Ashkan Soleymani补充道:“一旦我们更好地了解对称数据处理原理,就可以设计出更具解释性、更强大、更高效的神经网络架构。”该研究已于7月13日至19日在温哥华举行的国际机器学习会议(ICML 2025)上展示,并发布在arXiv预印本服务器上。
更多信息: Ashkan Soleymani 等人,《多项式时间中的精确不变性学习》,arXiv (2025)。期刊信息: arXiv













京公网安备 11010802043282号