人工智能在数学研究中的创新性测试
2026-02-10 08:49
收藏

近日,十位知名数学家合作开展了一项针对人工智能在数学研究领域创新潜力的实验。他们每人提供了一个各自研究领域中尚未发表、且未在网络上公开解答的数学问题,以此测试当前先进的人工智能模型是否能够超越其训练数据的范围,展现出独立解决新问题的创造性能力。

研究团队采用了OpenAI的ChatGPT 5.2 Pro和Google的Gemini 3.0 Deep Think两个语言模型,并赋予它们无限制的互联网搜索权限,旨在考察这些模型面对复杂数学挑战时的实际推理与求解能力,而非仅仅依赖已学习过的信息。

在初步测试中,菲尔兹奖得主数学家马丁·海雷尔分享了他的观察:人工智能在串联已知论证和执行计算方面表现良好,但在进行真正的原创性研究时能力有限。海雷尔指出:“迄今为止,我还没有看到一个令人信服的例子,能说明语言模型产生了真正的新颖想法或根本性的新概念。”他将人工智能比作一个“知道起点和终点,却找不到正确路径的差生”。

其他参与实验的数学家也报告了类似体验。数学家塔玛拉·科尔达指出,人工智能缺乏独立的观点,难以成为真正的研究合作者。海雷尔还提到,人工智能经常表现出过度自信,其提供的解答往往需要耗费大量精力进行验证,这类似于一个学生可能更擅长制造表面合理却缺乏实质的论述。

此次实验不仅是对人工智能技术能力的一次评估,同时也意在澄清“数学已被人工智能解决”的普遍误解。研究人员希望借此缓解学生和年轻学者对于数学学术生涯可能被人工智能取代的担忧。自上周起,这十个问题已在网络上公开,供全球研究者在2月13日官方解决方案发布前自行测试与讨论。

实验并未就此结束。研究团队计划在几个月后推出第二轮任务,结合第一轮中收集到的反馈,构建更为客观、系统的人工智能数学能力基准测试。这一持续性的研究努力,将有助于更全面、深入地评估人工智能在推动数学前沿研究中的实际作用与局限。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com