MassQL编程语言助力科学家快速发现未知环境污染物
2025-05-15 15:19
来源: 加州大学河滨分校
收藏

生物学家和化学家近日迎来了一种名为大规模查询语言(MassQL)的新编程工具,该工具能够以高效方式挖掘海量化学数据集,快速识别出此前未知的环境污染物,且无需用户编写代码。MassQL由加州大学河滨分校研发,其功能类似质谱数据搜索引擎,简化了复杂化学数据的分析流程。

质谱数据如同化学物质的“指纹”,记录了样本中分子的种类与含量,对识别环境污染物、新药成分等至关重要。MassQL的出现,使得非计算机科学背景的研究人员也能轻松驾驭这些数据。加州大学河滨分校计算机科学助理教授王明勋表示:“我们希望化学家和生物学家能自由探索数据,无需长时间学习编程。”

为验证MassQL的实用性,加州大学圣地亚哥分校的Nina Zhao利用该语言分析了全球公开的水样质谱数据,成功筛选出数千个有机磷酸酯分子,其中包括一些之前未被描述或分类的化合物。这些化学物质常作为阻燃剂使用,却可能对人类和动物的健康及生态系统造成负面影响。

MassQL不仅限于水样分析,其应用场景广泛。研究团队在论文中详细介绍了30多个潜在应用,如检测脂肪酸作为酒精中毒标志物、寻找新药以应对抗生素耐药性危机等。王明勋教授表示,MassQL的设计初衷是满足多种查询需求,节省科研人员的时间。

在开发过程中,研究团队面临的一大挑战是确保生命科学家对软件术语有统一理解。为此,他们咨询了约70位科学家,收集反馈并不断优化软件。如今,MassQL已准备好在更多实际场景中发挥作用,助力科学家揭示化学物质的奥秘。

更多信息: Tito Damiani 等人,《一种用于发现质谱数据模式的通用语言》,《自然方法》(2025)。期刊信息: 《自然方法》

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com