AI 搜索引擎错误率超 60%，CJR 研究揭示引用问题

2025-03-16 16:55

关键词:

《哥伦比亚新闻评论》(CJR)的 Tow 数字新闻中心研究显示，AI 搜索引擎在新闻引用准确性上表现堪忧，错误率超 60%。研究测试了 ChatGPT Search、Perplexity、Gemini、DeepSeek Search、Grok 3 等八款 AI 搜索工具，发现其错误回答新闻来源查询的比例高达 62%。研究人员 Klaudia Jaźwińska 和 Aisvarya Chandrasekar 指出，约 25% 美国人使用 AI 搜索替代传统搜索引擎，高错误率引发可靠性担忧。Perplexity 错误率最低(37%)，ChatGPT Search 为 67%，Grok 3 最高(94%)，显示工具间表现差异显著。

研究方法涉及从 20 家新闻出版商选取 200 篇文章，提取引文输入 AI 模型，要求返回标题、出版商、发布日期和 URL，共运行 1600 次查询。结果显示，AI 模型常在缺乏可靠信息时生成虚构答案，而非拒绝回答，错误表现具一致性。付费版本如 Perplexity Pro(20 美元/月)和 Grok 3(40 美元/月)虽正确回答更多查询，但错误率更高，归因于过度自信而非谨慎拒绝。研究还发现，AI 工具常忽略机器人排除协议，访问受限内容，如 Perplexity 识别国家地理付费墙文章，引用常指向联合内容而非原始来源，URL 伪造严重，Grok 3 200 次引用中 154 次为断链。

研究对出版商影响深远，阻止 AI 爬虫可能失去引用，允许则难回流流量。《时代》杂志 COO Mark Howard 担忧内容透明度和控制，强调 AI 工具需改进，但也指出用户应警惕免费工具准确性。OpenAI 和 Microsoft 回应研究，承诺优化引用准确性，遵守出版商指令。研究延续 2024 年 11 月报告，凸显 AI 搜索需提升可信度，出版商与 AI 公司需合作解决引用与流量问题。

美国

智能数据处理人工智能

上一篇：Oracle 成 TikTok 美国云技术合作伙伴首选，交易前景仍不明朗

下一篇：欧盟迎来替代应用商店，挑战苹果App Store主导地位