美国LF AI & Data基金会成立工作组制定AI原生文档标准
2026-06-10 13:39
收藏

维度网讯,Linux基金会旗下的LF AI & Data基金会成立了一个工作组,专注于开发DocLang规范,旨在为跨AI和智能体工作流提供可互操作的文档处理标准。

AI笔记本电脑

该工作组由首要成员IBM、英伟达(Nvidia)和红帽(Red Hat)创立,任务是创建一种开放、通用、AI原生的文档格式,旨在改善企业为AI系统准备、交换和管理文档数据的方式。贡献者ABBYY(泰比)和人类信号(Human Signal)也将参与其开发。

公告称,当前企业在各种碎片化的文档格式中运作,包括PDF、JPEG以及其他主要为人类阅读而非AI解读构建的文件类型。随着组织越来越依赖生成式AI和智能体系统,这种脱节可能在从业务文档中提取意义时引入复杂性、增加成本并降低可靠性。

LF AI & Data的执行董事马克·科利尔(Mark Collier)表示,DocLang规范工作组的目标是制定一个供应商中立、可互操作的标准,帮助组织更可靠、更透明、大规模地准备用于AI的文档数据。工作组发布的一份信息文档称,PDF为打印而生,DOCX为编辑器而生,DocLang为下一个时代而生——一个模型可以真正信任的机器可读文档标准。DocLang为任何类型的文档定义了一种结构化的、机器可读的格式,如同数据的JSON、网络的HTML一样,任何工具都可以实现,任何流水线都可以使用。

独立技术分析师卡米·利维(Carmi Levy)表示,现有文档标准在数十年来让全球利益相关者能够自信地协作,但随AI重塑工作方式的规则,这些标准迫切需要更新。他认为DocLang代表了在文档标准方面实现某种基础基线的最早、最大的希望,有望使工作流比现在更智能、更高效、风险更低。采用开源、供应商中立的方法确保集体利益优先于特定供应商的需求,早期围绕网络、文档、网页和云的标准制定工作推动了定义现代生活的自由流动的数字格局。

摩尔洞察与战略(Moor Insights & Strategy)首席分析师杰森·安德森(Jason Andersen)认为,DocLang这类标准应用于内容摄取时,用户向智能体上传文档可运行一个技能将文档预处理为DocLang标准格式,从而节省token。他设想这些标准需保留人类能够做想做的事情且无需知道编码即可熟练使用。预处理将元数据或代码附加到文档后,只要维护得当,治理可能更易实现,但规范中尚未体现这一点,他鼓励团队考虑。

信息科技研究集团(Info-Tech Research Group)高级研究分析师亚兹·帕拉尼查米(Yaz Palanichamy)表示,AI原生文档概念从用户生产力角度看,有助于组织为AI嵌入系统准备文档数据。但他强调,组织合规控制和总体治理模型绝对必要,还需了解公司技术准备度是否能够标准化内部文档管理实践。若不进行内部可行性研究或提前准备,变更管理无法适当执行,可能阻碍组织进一步成熟或扩展AI嵌入文档处理能力。从治理角度仍需适当审查若干组织控制措施,确保以负责任和安全的方式扩展这一新的协作标准和工具包。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com