蒙特利尔大学心理学系Karim Jerbi教授领导的研究团队,包括人工智能先驱Yoshua Bengio教授,发表了关于大型语言模型与人类创造力对比的迄今最大规模研究。研究结果显示,生成式人工智能在创造力方面取得重大进展,部分模型已超越人类平均创造力,但最具创造力的人类仍明显优于最先进的人工智能系统。

研究测试了包括ChatGPT、Claude、Gemini等在内的多个大型语言模型,并与10万名人类参与者的创造力表现进行比较。结果发现,GPT-4等模型在发散性语言创造力任务中,表现已超过人类平均水平。然而,最具创造力的一半人类参与者平均表现优于所有测试的AI模型,前10%的人类创作者优势更为显著。研究共同第一作者安托万·贝勒马尔-佩潘和弗朗索瓦·莱斯皮纳斯指出,尽管AI已超越人类平均创造力,但最高水平的创造力仍为人类独有。
为衡量创造力,研究采用发散联想任务(DAT)等心理学工具,要求人类和AI参与者写出十个语义不同的单词。人类表现与其他创造力测试结果一致,且测试便捷,公众可在线参与。此外,研究还比较了AI模型和人类在创意写作任务上的表现,包括俳句创作、电影剧情简介和短篇小说,结果再次表明人类创作者保持明显优势。
研究还探讨了人工智能创造力的调节方式,发现通过调整模型“温度”和指令措辞,可显著影响AI创造力。低温下AI输出谨慎可预测,高温下则引入更多随机性,产生更多样化关联。这凸显了人机交互在创造过程中的关键作用。
面对人工智能可能取代创意工作者的担忧,Jerbi教授表示,生成式人工智能已成为服务人类创造力的强大工具,不会取代创造者,而是会改变人们想象、探索和创造的方式。研究邀请我们重新思考人工智能作为创意助手的角色,探索新型创意合作模式。
更多信息:标题:《人类和大型语言模型中的发散性创造力》,发表于:《科学报告》(2026)











