美国Protege公司推出DataLab研究计划，推动AI数据科学化发展

2026-03-13 09:28

关键词:

美国AI数据平台Protege近日推出DataLab研究计划，旨在将AI数据转化为更严谨的科学学科，以应对当前人工智能发展中日益凸显的数据瓶颈问题。随着AI系统向复杂实际应用演进，数据质量、选择和评估已成为制约进步的关键因素。

DataLab作为一个专门的研究机构，致力于帮助研究人员解决数据科学领域的核心挑战。该团队由内部专家组成，并已获得包括亚马逊、苹果、Alphabet、微软、英伟达、Meta和特斯拉等多家科技巨头的前期合作支持。最近一项Snowflake调查显示，尽管生成式AI项目带来显著回报，但数据准备和质量问题仍是普遍障碍，这进一步印证了优化AI数据层的重要性。

Protege首席执行官Bobby Samuels指出：“我们理解驱动AI的三个核心支柱：模型、芯片和数据。我们相信，通过正确的数据集——第三个尚未充分发展的支柱——可以推动整个前沿向前发展。”他强调，公司“创建DataLab是为了将数据视为基础设施，而非废弃物”，主张通过建立更好的标准、可重复性和科学规范来提升系统可靠性。

DataLab将聚焦三个核心领域：促进科学合作、构建高价值数据集和数据产品，以及领导AI数据研究。这项工作将兼顾学术探索和商业应用，计划发布基准测试和技术研究成果。Protege联合创始人Engy Ziedan表示：“DataLab的优势在于其整合通常孤立观点的能力。”他进一步解释，这“需要在边际处思考，即我们权衡数据点在学习的边际价值和选择错误数据集的机会成本”，以确保数据集设计具备纪律性和对真实复杂性的深刻理解。