美国Burke推出合成数据质量FAR评估框架
2026-06-16 10:12
收藏

维度网讯,Burke, Inc.发布了一项关于合成数据在商业决策中可靠性的新研究,并推出了评估合成数据质量的FAR框架,该方法从保真度、真实性和分辨率三个维度进行衡量。

随着合成数据选项日益普及,学术界和产业界开始关注它们能否可靠地指导现实世界的决策。Burke的研究对比了多种合成方法,测试了基于大语言模型(LLM)的合成小组能否替代人类受访者,比较了生成数据模型与合成小组的表现,并考察了底层人类数据质量在合成数据场景中的重要性。

研究结果显示,基于LLM的合成小组在早期探索阶段可能具有价值,但在依赖定量洞察的决策层面尚不可靠:在通常引用的80%准确率水平下,基于LLM的合成数据在大约60%的测试业务场景中得出错误结论。相比之下,使用经过验证的受访者级人类数据(称为生成数据模型)的方法表现明显更优,显示出在决策支持应用中具有更广阔的潜力。

该研究的核心部分是Burke的FAR框架,该框架从三个维度评估合成数据质量:保真度,指合成数据是否与底层事实来源一致;真实性,指合成响应是否反映真实的变异性,而非单纯复制现有数据;分辨率,指变量、细分市场和商业结论之间的关系是否得以保留。

该研究还确定了决策可靠性的一个阈值,在该阈值下,合成方法更可能保留研究结论,这为组织区分有前景的应用与不可靠应用提供了重要信号。

Burke数据策略副总裁Eli Moore表示,组织听到越来越多关于合成数据的强烈声明,但关键问题不在于合成数据听起来是否像客户,而在于它是否会导致与直接对话相同的结论。Burke企业创新高级副总裁Thania Farrar指出,人工智能正在影响组织生成洞察和做出决策的方式,有机会结合高质量的人类数据、先进建模和专家判断,以创建更快、更智能、更可靠的结果,同时将真实的人声置于研究的核心。Burke总裁兼首席执行官Tara Marotti表示,公司的目标始终是帮助客户为其业务做出最佳决策,这项研究能够帮助客户对每种方法的优势、局限性和最佳用途充满信心。

这些发现是Burke Labs工作的成果,该部门致力于测试和加速新的AI和技术解决方案,以改变受访者体验、分析和报告。

Burke, Inc.是一家领先的决策智能咨询公司,通过高质量研究、先进分析和专家指导下的洞察、战略、创新和培训,帮助组织加速增长。公司成立于1931年,将严谨的测量与以人为本的咨询相结合,帮助客户更好地了解人、市场与机遇。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com