维度网讯,Databricks与Nvidia联合推出一个名为Genesis Workbench的开源项目,旨在解决生命科学领域AI应用落地时模型与企业数据及计算基础设施难以协同的痛点。
药物发现研究中,企业内部的研究数据、实验室结果与GPU资源通常分散于独立环境,这给协作与结果复现带来困难。与此同时,AI模型数量持续增长,如何将这些模型与专有数据及现有研究工作流程结合,成为制药与生物技术公司面临的实际挑战。Genesis Workbench并非引入新模型,而是将企业数据、Nvidia的BioNeMo模型和GPU基础设施整合到Databricks的统一环境中,帮助研究人员从设置AI工作流程转向实际应用。
该平台聚焦于药物发现全流程,将基因组学、单细胞分析、蛋白质工程和小分子设计的工具汇集到单一平台、一个用户界面和一个治理模型下。根据Databricks的说法,通过使用Databricks AI Search集中公共和专有数据集,可以消除对外部API的依赖,使从基因组学发现顺畅流入单细胞验证、靶点结构预测、候选物对接、ADMET排序等步骤。平台依赖通过Unity Catalog管理的开源模型,使用MLflow跟踪实验,并由GPU支持的模型服务处理推理。Nvidia贡献了BioNeMo Agent Toolkit、Parabricks等技术以及生物学和化学模型组合。
Genesis Workbench一个显著特点是完全在客户的Databricks环境中运行,这使得组织可以将敏感研究数据保留在现有治理控制范围内,无需发送至第三方AI服务。随着生物AI发展,平台支持灵活扩展,组织可以添加或替换单个模块而无需重建整个研究环境。

生命科学研究涵盖基因组学、结构生物学、化学与临床数据等多个学科,且需处理高度监管和专有的数据。在这种环境中构建AI应用,不仅需要原始计算能力,还需要安全的数据访问和整合新模型的灵活性。对于Databricks,Genesis Workbench是其从分析领域深入基于湖仓的AI应用的案例;Nvidia则借此将BioNeMo及加速计算软件置于企业药物发现工作流程的中心。









