加拿大安大略癌症研究所(OICR)与多伦多大学的研究团队开发出一种名为OncoGAN的人工智能系统,该系统能够生成模拟多种癌症类型的合成基因组。这项研究成果已发表于《Cell Genomics》期刊。
该人工智能系统基于生成对抗网络技术,模拟了包括乳腺癌、前列腺癌和胰腺癌在内的八种癌症类型的肿瘤基因组特征。生成的合成数据不仅保留了真实基因组的变异模式,还可为基因组分析工具提供基准测试平台,推动精准肿瘤学算法的发展。
当前癌症基因组分析面临两大挑战:一是训练数据有限,现有工具多基于少量陈旧基因组数据开发;二是出于患者隐私保护,最新临床基因组数据难以公开获取。OncoGAN通过生成与真实患者无关联但科学价值显著的合成基因组,有效解决了数据可及性与隐私保护间的矛盾。
论文资深作者、OICR代理科学总监林肯·斯坦博士表示:"通过人工智能系统创造的合成基因组不包含任何个人健康信息,可以实现无障碍共享。同时,由于合成数据的'基本事实'完全已知,能为算法验证提供更可靠的基础。"
研究团队已公开释放800个模拟基因组数据集供科研人员使用。这些数据正用于训练斯坦实验室的新型分析工具,有望提升癌症基因组变异检测的准确性。
第一作者安德尔·迪亚兹-纳瓦罗指出:"明确基因组的基准真相意味着我们能更有效地评估新算法性能,推动诊断工具优化。"随着分析工具的持续改进,科学家有望更深入理解癌症发生机制,为早期诊断和个性化治疗提供支持。
更多信息: Ander Díaz-Navarro 等人,利用生成式人工智能(Generative AI)进行合成癌症基因组的计算机生成,Cell Genomics(2025)。期刊信息: Cell Genomics














京公网安备 11010802043282号