苏黎世联邦理工学院研发MetaGraph工具
2025-10-13 11:56
收藏

苏黎世联邦理工学院计算机科学家开发出名为“MetaGraph”的DNA序列全文检索工具,首次实现海量生物数据的高效搜索。该工具通过数学图表压缩技术,将全球公开的DNA/RNA序列数据(约100PB)存储于几块硬盘中,支持用户直接输入目标序列进行秒级定位,彻底改变了传统依赖元数据下载的耗时模式。研究发表于《自然》杂志,标志着基因数据检索进入“全文搜索”时代。

MetaGraph 框架

传统DNA数据库检索需通过描述性元数据筛选,再下载完整数据集分析,过程繁琐且易遗漏信息。MetaGraph的核心创新在于构建复杂数学图表,将序列数据转化为可压缩的“数字摘要”,在保留关键关联信息的同时实现300倍压缩率。研究负责人Gunnar Rätsch教授比喻:“这就像将整本书浓缩为故事大纲,所有主线情节完整但体积大幅缩小。”该工具支持每兆碱基0.74美元的低成本大规模查询,且计算资源需求随数据量增长呈亚线性增加,显著优于现有方法。

目前,MetaGraph已索引全球近半序列数据集,剩余部分预计年内完成。工具开源后,不仅可为抗生素耐药性研究、新发传染病监测提供实时基因比对支持,未来或扩展至阳台植物基因识别等民用场景。研究团队成员André Kahles博士指出:“我们正在突破数据紧凑性与信息完整性的平衡极限。”随着DNA测序成本持续下降,这一技术有望推动个性化医疗与生物安全领域的范式转变。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com