伊利诺伊大学厄巴纳-香槟分校研究团队利用人工智能技术开发临床试验质量评估新方法。该研究通过训练自然语言处理模型,自动化检测医学研究报告中是否符合CONSORT标准要求,为提升临床试验报告质量提供技术支持。
随机对照临床试验是评估新疗法安全性与有效性的重要依据。然而,现有医学文献中常出现试验细节报告不完整的现象,影响对其研究质量的准确判断。伊利诺伊大学研究团队运用PSC的Bridges-2超级计算机系统,开发能够识别临床试验报告中缺失信息的人工智能工具。
信息科学副教授Halil Kilicoglu表示:“临床试验被认为是临床治疗的最佳证据类型。如果一种药物要用于治疗某种疾病,就需要证明它是安全有效的。但临床试验的出版物存在很多问题,它们通常没有足够的细节,对具体操作过程不够透明,因此我们很难评估其证据的严谨性。”
研究团队基于CONSORT 2010声明和SPIRIT 2013声明中的83项建议,构建了人工智能训练数据集。他们收集了2011年至2022年间发表的200篇临床试验文章,使用Bridges-2系统的图形处理单元训练Transformer神经网络模型。该人工智能临床试验评估工具通过分析文本模式,学习识别符合标准的研究报告特征。
在模型测试中,最佳自然语言处理程序在单句层面的F₁得分为0.742,在全文层面的得分为0.865。研究人员于2025年2月在《科学数据》期刊发表了这些初步研究成果。Kilicoglu指出:“我们正在开发深度学习模型,这些模型需要GPU。注册Bridges后就能获得GPU资源,且所需软件通常都已安装完毕,这为研究工作提供了便利。”
团队计划进一步优化该人工智能临床试验评估工具,通过增加训练数据量和采用模型蒸馏技术提升性能。最终目标是开发开源工具,供研究作者和学术期刊使用,帮助改进临床试验的设计实施和报告质量。这种基于CONSORT标准的人工智能检测方法,有望促进医学研究领域的规范化发展。
更多信息: Lan Jiang 等,SPIRIT-CONSORT-TM:评估临床试验方案和结果出版物透明度的语料库,Scientific Data(2025)。期刊信息: 科学数据













京公网安备 11010802043282号