OpenAI发布生命科学推理模型GPT-Rosalind,RNA序列预测准确率超95%人类专家
2026-04-17 09:35
收藏

维度网讯,OpenAI于当地时间4月16日宣布推出GPT-Rosalind,一款专为支持生物学、药物发现和转化医学研究构建的前沿推理模型。该模型以英国化学家罗莎琳德·富兰克林命名,是OpenAI生命科学系列的首个模型。GPT-Rosalind作为研究预览版在ChatGPT、Codex和API中面向符合条件的客户开放,预览期间不消耗现有使用额度。

GPT-Rosalind定位为生命科学领域的专业推理引擎。据OpenAI生命科学产品负责人王昀昀介绍,该模型旨在解决生物学研究者面临的两大核心障碍:一是数十年基因组测序和蛋白质生物化学积累的海量数据超出个人处理能力,二是生物学高度细分的子领域造成知识壁垒。为此,OpenAI在通用大模型基础上训练了50种常见生物学工作流,并接入主流公共数据库,使模型能够通过已知通路和调控机制连接基因型与表型,推断蛋白质的结构或功能属性,并筛选潜在药物靶点。OpenAI生命科学研究负责人Joy Jiao强调,模型目标并非替代科学家,而是帮助研究者加速科学流程中最复杂、最耗时的环节。

性能评测显示GPT-Rosalind在多项基准测试中表现突出。据VentureBeat报道,GPT-Rosalind在生物信息学基准BixBench上取得已公开模型中的最高分。在涵盖文献检索、序列操作、实验方案设计等11项研究任务的LABBench2基准测试中,GPT-Rosalind在6项任务上超过GPT-5.4,提升最显著的是分子克隆实验设计任务。在与AI基因治疗公司Dyno Therapeutics联合开展的评测中,GPT-Rosalind使用未公开且未被训练数据污染的RNA序列进行序列功能预测,十次提交中的最优结果排名在人类专家历史成绩第95百分位以上,序列生成排在第84百分位左右。

访问权限受严格管控。OpenAI对GPT-Rosalind采取可信访问部署框架,目前仅限美国本土实体申请使用。王昀昀表示,限制使用权限旨在最大化研究价值的同时降低滥用风险。系统内置高精度标记机制,一旦用户触及与生物武器相关的特定指标或阈值将自动发出警示。首批合作客户包括安进、莫德纳、艾伦研究所及赛默飞世尔科技。OpenAI还与洛斯阿拉莫斯国家实验室合作,共同探索AI引导的蛋白质与催化剂设计。

OpenAI同步在GitHub开源了Codex生命科学研究插件,接入超过50个公共多组学数据库、文献源和生物信息学工具,覆盖人类遗传学、功能基因组学、蛋白质结构和生物化学等领域。该插件对所有用户免费开放,不限于GPT-Rosalind,也可搭配通用模型使用。选择生命科学作为首个垂直行业,OpenAI给出量化理由:一款新药从靶点发现到获批上市平均需要10至15年,进入临床试验的药物仅十分之一最终获批,AI在早期发现阶段的加速可向下游复利式传导,提升整条管线的成功率。

科技巨头竞逐生命科学AI赛道持续升温。谷歌DeepMind两位科学家凭借蛋白质结构预测系统AlphaFold获得2024年诺贝尔化学奖,DeepMind旗下Isomorphic Labs于2026年2月推出计算药物设计系统IsoDDE。OpenAI与Anthropic、谷歌近年来在AI医疗与科学应用领域的投入不断加大。但现实挑战依然存在:据OpenAI发布会信息,目前尚无完全由AI发现或设计的药物通过三期临床试验,仅少数进入早期临床阶段。百余名科学家组成的国际团队已呼吁加强对训练AI系统的敏感生物数据管控,防范技术被滥用于制造危险病原体。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com