AI 搜索引擎错误率超 60%,CJR 研究揭示引用问题
2025-03-16 16:55
收藏

《哥伦比亚新闻评论》(CJR)的 Tow 数字新闻中心研究显示,AI 搜索引擎在新闻引用准确性上表现堪忧,错误率超 60%。研究测试了 ChatGPT Search、Perplexity、Gemini、DeepSeek Search、Grok 3 等八款 AI 搜索工具,发现其错误回答新闻来源查询的比例高达 62%。研究人员 Klaudia Jaźwińska 和 Aisvarya Chandrasekar 指出,约 25% 美国人使用 AI 搜索替代传统搜索引擎,高错误率引发可靠性担忧。Perplexity 错误率最低(37%),ChatGPT Search 为 67%,Grok 3 最高(94%),显示工具间表现差异显著。

研究方法涉及从 20 家新闻出版商选取 200 篇文章,提取引文输入 AI 模型,要求返回标题、出版商、发布日期和 URL,共运行 1600 次查询。结果显示,AI 模型常在缺乏可靠信息时生成虚构答案,而非拒绝回答,错误表现具一致性。付费版本如 Perplexity Pro(20 美元/月)和 Grok 3(40 美元/月)虽正确回答更多查询,但错误率更高,归因于过度自信而非谨慎拒绝。研究还发现,AI 工具常忽略机器人排除协议,访问受限内容,如 Perplexity 识别国家地理付费墙文章,引用常指向联合内容而非原始来源,URL 伪造严重,Grok 3 200 次引用中 154 次为断链。

研究对出版商影响深远,阻止 AI 爬虫可能失去引用,允许则难回流流量。《时代》杂志 COO Mark Howard 担忧内容透明度和控制,强调 AI 工具需改进,但也指出用户应警惕免费工具准确性。OpenAI 和 Microsoft 回应研究,承诺优化引用准确性,遵守出版商指令。研究延续 2024 年 11 月报告,凸显 AI 搜索需提升可信度,出版商与 AI 公司需合作解决引用与流量问题。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com
相关产品