美国Protege公司推出DataLab研究计划,推动AI数据科学化发展
2026-03-13 09:28
收藏

美国AI数据平台Protege近日推出DataLab研究计划,旨在将AI数据转化为更严谨的科学学科,以应对当前人工智能发展中日益凸显的数据瓶颈问题。随着AI系统向复杂实际应用演进,数据质量、选择和评估已成为制约进步的关键因素。

DataLab作为一个专门的研究机构,致力于帮助研究人员解决数据科学领域的核心挑战。该团队由内部专家组成,并已获得包括亚马逊、苹果、Alphabet、微软、英伟达、Meta和特斯拉等多家科技巨头的前期合作支持。最近一项Snowflake调查显示,尽管生成式AI项目带来显著回报,但数据准备和质量问题仍是普遍障碍,这进一步印证了优化AI数据层的重要性。

Protege首席执行官Bobby Samuels指出:“我们理解驱动AI的三个核心支柱:模型、芯片和数据。我们相信,通过正确的数据集——第三个尚未充分发展的支柱——可以推动整个前沿向前发展。”他强调,公司“创建DataLab是为了将数据视为基础设施,而非废弃物”,主张通过建立更好的标准、可重复性和科学规范来提升系统可靠性。

DataLab将聚焦三个核心领域:促进科学合作、构建高价值数据集和数据产品,以及领导AI数据研究。这项工作将兼顾学术探索和商业应用,计划发布基准测试和技术研究成果。Protege联合创始人Engy Ziedan表示:“DataLab的优势在于其整合通常孤立观点的能力。”他进一步解释,这“需要在边际处思考,即我们权衡数据点在学习的边际价值和选择错误数据集的机会成本”,以确保数据集设计具备纪律性和对真实复杂性的深刻理解。

随着AI技术深入科学和关键应用领域,对数据精度的要求显著提高。研究人员日益关注数据的边际价值,即单个数据点如何影响模型行为。Protege表示,DataLab将在此层面发挥作用,通过科学化决策数据选择、结构和影响评估,确保AI系统在实际环境中可靠运行,为AI数据科学化发展提供支撑。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com