人工智能临床试验质量评估与CONSORT标准自动化检测研究
2025-10-25 16:12
来源:匹兹堡超级计算中心
收藏

伊利诺伊大学厄巴纳-香槟分校研究团队利用人工智能技术开发临床试验质量评估新方法。该研究通过训练自然语言处理模型,自动化检测医学研究报告中是否符合CONSORT标准要求,为提升临床试验报告质量提供技术支持。

随机对照临床试验是评估新疗法安全性与有效性的重要依据。然而,现有医学文献中常出现试验细节报告不完整的现象,影响对其研究质量的准确判断。伊利诺伊大学研究团队运用PSC的Bridges-2超级计算机系统,开发能够识别临床试验报告中缺失信息的人工智能工具。

信息科学副教授Halil Kilicoglu表示:“临床试验被认为是临床治疗的最佳证据类型。如果一种药物要用于治疗某种疾病,就需要证明它是安全有效的。但临床试验的出版物存在很多问题,它们通常没有足够的细节,对具体操作过程不够透明,因此我们很难评估其证据的严谨性。”

研究团队基于CONSORT 2010声明和SPIRIT 2013声明中的83项建议,构建了人工智能训练数据集。他们收集了2011年至2022年间发表的200篇临床试验文章,使用Bridges-2系统的图形处理单元训练Transformer神经网络模型。该人工智能临床试验评估工具通过分析文本模式,学习识别符合标准的研究报告特征。

在模型测试中,最佳自然语言处理程序在单句层面的F₁得分为0.742,在全文层面的得分为0.865。研究人员于2025年2月在《科学数据》期刊发表了这些初步研究成果。Kilicoglu指出:“我们正在开发深度学习模型,这些模型需要GPU。注册Bridges后就能获得GPU资源,且所需软件通常都已安装完毕,这为研究工作提供了便利。”

团队计划进一步优化该人工智能临床试验评估工具,通过增加训练数据量和采用模型蒸馏技术提升性能。最终目标是开发开源工具,供研究作者和学术期刊使用,帮助改进临床试验的设计实施和报告质量。这种基于CONSORT标准的人工智能检测方法,有望促进医学研究领域的规范化发展。

更多信息: Lan Jiang 等,SPIRIT-CONSORT-TM:评估临床试验方案和结果出版物透明度的语料库,Scientific Data(2025)。期刊信息: 科学数据

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com