德国于利希研究中心开发Quinex AI系统,自动提取科学论文中的定量数据
2026-04-19 12:10
来源:于利希研究中心
收藏

德国于利希研究中心的研究人员开发了一个名为Quinex的AI系统,能够自动识别科学论文中的数字,进行分类并转化为结构化数据。这个AI系统利用语言模型,消除了传统手动提取定量信息的耗时需求。

AI reads science: New system understands numbers and correlations

在能源、气候和材料研究等领域,科学文献中常包含大量定量数据,如效率、成本和排放值。随着出版物数量激增,手动分析变得不切实际。Quinex框架自动化了这一过程,识别数值并分配单位,同时捕获测量内容、时间和方法等上下文信息。例如,它将“预计2025年效率水平为63%至71%”这样的句子转化为结构化数据集。

与专有AI解决方案不同,Quinex基于开放、高效的语言模型,专门训练以处理科学文本中的定量信息。它在数字和单位识别上准确率约98%,属性分类准确率约87%。该系统已在数千篇科学摘要中测试,成功提取发电成本、地震震级等数据,与参考值高度匹配。

主要作者Jan Göpfert表示:“语言模型为科学提供了新视角,有助于自动化文献搜索和趋势分析。”研究数据管理组负责人Patrick Kuckertz博士补充说:“Quinex旨在减轻研究人员的常规工作,帮助他们更快获得见解。”该研究已发表在《The Innovation》期刊上。

尽管Quinex存在局限,如有时误解分散的引用,但它设计透明,每个数字都可追溯来源。团队正通过额外数据集和模型改进该系统,以适应不同研究需求。Quinex作为开源项目提供,鼓励全球研究人员在能源、化学等领域测试和扩展。

出版详情:作者:Jülich Research Centre;标题:《This AI mines the numbers buried in scientific papers and turns them into usable data fast》;发表于:《The Innovation》(2026);期刊信息: The Innovation

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com