全球首个百亿级可部署基因组基础模型诞生
2025-10-23 10:13
收藏
23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
算法架构方面,Genos通过“混合专家”架构,精准调度强相关“专家”算法协同处理,在汇总百亿级庞大参数时成功降低推理成本和资源消耗,让模型既强大、又好用。
测试结果显示,Genos在直接面向临床应用的致病性突变解读任务中,准确率达92%;结合科学基础模型后,准确率高达98.3%。多项综合评测结果也显示,Genos超越现有最佳水平模型。
华大生命科学研究院相关负责人说,Genos模型已在HuggingFace(抱抱脸)、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
下一篇:全球首创十大介入创新技术发布
相关推荐

中国字节跳动拆分AI制药部门并寻求独立融资
2026-06-16

英国个性化营养品牌Nourished母公司Rem3dy Health获约1400万英镑融资加速全球扩张
2026-06-16

美国儿童青少年心理健康服务商InStride Health获3000万美元C轮融资
2026-06-16

美国强生投资超10亿美元扩建美国隐形眼镜工厂
2026-06-16

德国拜耳成为国际干细胞研究学会联盟创始成员
2026-06-16

非洲疾控中心与利比亚加强区域卫生安全合作
2026-06-16

中国Neuracle脑机接口芯片获NMPA批准并纳入医保
2026-06-16

美国cliexa与OpiSafe合作推出AI驱动阿片类药物与行为健康管理平台
2026-06-16

荷兰凯杰扩展QIAcuity数字PCR生态系统 装机超3200台
2026-06-16

韩国峨山医疗中心重离子治疗中心动工,2031年启用
2026-06-16