AI先驱因强化学习工作荣获2024年图灵奖
2025-03-06 13:58
收藏

两位开创性的计算机科学家因其在强化学习领域的杰出贡献荣获2024年图灵奖。强化学习是机器学习的一个分支,通过基于奖励的试错方法,使机器能够在受限或动态环境中学习和适应。获奖者分别是马萨诸塞大学阿默斯特分校名誉教授安德鲁·巴托(Andrew G. Barto)和阿尔伯塔大学教授理查德·萨顿(Richard S. Sutton)。

自1980年代以来,巴托和萨顿通过一系列开创性论文开发了关键算法和理论,其中包括对时间差分学习(Temporal Difference Learning)这一强化学习技术的研究。两人还合著了学术教科书《强化学习:导论》(Reinforcement Learning: An Introduction),该书已成为该领域的经典之作。

图灵奖以数学家艾伦·图灵(Alan Turing)的名字命名,他在1950年代发表的论文《计算机与智能》中探讨了计算机是否能够思考的问题,并触及了从经验中学习的类似概念。近年来,强化学习因Google DeepMind使用该技术开发的AlphaGo AI而备受关注,AlphaGo成功击败了世界顶级围棋选手。此外,中国AI新秀DeepSeek也因其依赖强化学习的R1推理模型而成为头条新闻,该模型显著降低了基础模型的成本。

图灵奖由计算机协会(ACM)管理,通常被称为“计算界的诺贝尔奖”。然而,诺贝尔奖本身近年来也开始涉足计算领域,尤其是在人工智能方面。2023年,Geoff Hinton和John Hopfield因在基础AI领域的工作获得诺贝尔物理学奖,而DeepMind的Demis Hassabis和John Jumper则因AlphaFold的研究获得诺贝尔化学奖。

ACM主席Yannis Ioannidis在一份新闻稿中表示:“从认知科学、心理学到神经科学的研究领域激发了强化学习的发展,这为人工智能的一些最重要的进步奠定了基础,并让我们更深入地了解大脑的工作原理。巴托和萨顿的工作不仅是当前进展的基石,强化学习的不断发展还为计算和许多其他学科的进一步发展提供了巨大潜力。授予他们我们领域最负盛名的奖项是再合适不过的。”

其他获得图灵奖的著名人工智能先驱包括Meta的首席AI科学家Yann LeCun,他于2018年与Geoff Hinton和Yoshua Bengio共同获奖,以表彰他们在深度神经网络领域的工作。

巴托和萨顿将分享由Google支持的100万美元现金奖励。他们的研究不仅推动了AI技术的发展,还为未来计算科学的进步奠定了坚实基础。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com