美国Burke推出合成数据质量FAR评估框架

2026-06-16 10:12

关键词:

维度网讯，Burke, Inc.发布了一项关于合成数据在商业决策中可靠性的新研究，并推出了评估合成数据质量的FAR框架，该方法从保真度、真实性和分辨率三个维度进行衡量。

随着合成数据选项日益普及，学术界和产业界开始关注它们能否可靠地指导现实世界的决策。Burke的研究对比了多种合成方法，测试了基于大语言模型（LLM）的合成小组能否替代人类受访者，比较了生成数据模型与合成小组的表现，并考察了底层人类数据质量在合成数据场景中的重要性。

研究结果显示，基于LLM的合成小组在早期探索阶段可能具有价值，但在依赖定量洞察的决策层面尚不可靠：在通常引用的80%准确率水平下，基于LLM的合成数据在大约60%的测试业务场景中得出错误结论。相比之下，使用经过验证的受访者级人类数据（称为生成数据模型）的方法表现明显更优，显示出在决策支持应用中具有更广阔的潜力。

该研究的核心部分是Burke的FAR框架，该框架从三个维度评估合成数据质量：保真度，指合成数据是否与底层事实来源一致；真实性，指合成响应是否反映真实的变异性，而非单纯复制现有数据；分辨率，指变量、细分市场和商业结论之间的关系是否得以保留。

该研究还确定了决策可靠性的一个阈值，在该阈值下，合成方法更可能保留研究结论，这为组织区分有前景的应用与不可靠应用提供了重要信号。

Burke数据策略副总裁Eli Moore表示，组织听到越来越多关于合成数据的强烈声明，但关键问题不在于合成数据听起来是否像客户，而在于它是否会导致与直接对话相同的结论。Burke企业创新高级副总裁Thania Farrar指出，人工智能正在影响组织生成洞察和做出决策的方式，有机会结合高质量的人类数据、先进建模和专家判断，以创建更快、更智能、更可靠的结果，同时将真实的人声置于研究的核心。Burke总裁兼首席执行官Tara Marotti表示，公司的目标始终是帮助客户为其业务做出最佳决策，这项研究能够帮助客户对每种方法的优势、局限性和最佳用途充满信心。

这些发现是Burke Labs工作的成果，该部门致力于测试和加速新的AI和技术解决方案，以改变受访者体验、分析和报告。

Burke, Inc.是一家领先的决策智能咨询公司，通过高质量研究、先进分析和专家指导下的洞察、战略、创新和培训，帮助组织加速增长。公司成立于1931年，将严谨的测量与以人为本的咨询相结合，帮助客户更好地了解人、市场与机遇。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国