中国智源研究院发布悟界Physis通用世界基座模型

2026-06-12 16:31

关键词:

维度网讯，6月12日，第八届北京智源大会在北京举行，智源研究院发布通用世界基座模型悟界·Physis-v0.1。该模型面向真实物理世界建模，强调物理正确、动作因果可溯、长程一致和通用泛化能力，可适配机器人、视频生成、游戏、工业等真实物理应用场景，为具身智能和工业智能系统提供底层支撑。

这次发布把世界模型推到更基础的位置。大语言模型擅长文本理解和推理，多模态模型进一步连接图像、语音和视频，但机器人、工业仿真、自动驾驶、智能制造和复杂空间任务，需要的不只是“看懂画面”，还要理解物体如何运动、动作如何产生结果、环境变化是否符合物理规律。悟界·Physis-v0.1的定位，正是让模型从数字内容生成，继续向物理世界预测和交互能力延伸。

世界模型的难点在于连续性。一个视频片段可以看起来清晰，但如果物体运动不符合重力、碰撞关系前后矛盾，或者动作因果无法追踪，就难以服务真实机器人和工业场景。对具身智能来说，机器人执行任务前需要判断动作会带来什么后果;对工业应用来说，模型需要在生产流程、设备运行、材料变化和空间约束中保持一致推演。Physis-v0.1强调长程一致与因果可溯，说明模型目标并不是只生成更逼真的画面，而是支撑可验证、可执行、可迁移的物理推理。

智源研究院同步发布的成果还包括多模态神经科学大模型悟界·Brainμ1.0，以及智能体、基础软硬件生态和开源生态建设进展。这使“悟界”体系呈现出更清晰的多方向布局：一端面向物理世界和具身智能，一端连接脑科学和生命科学，另一端则通过智能体与软硬件生态支撑应用扩展。对人工智能基础研究机构而言，这种组合意味着研究重点正在从单一模型能力，转向模型、数据、智能体、平台和开源生态的系统建设。

Physis-v0.1对机器人行业尤其重要。当前人形机器人和移动操作机器人已经能完成抓取、搬运、巡检、药房拣货等任务，但真正限制规模落地的，是复杂环境中的长期稳定性和泛化能力。机器人不能只依靠预设程序在固定场景中动作，它需要理解桌面、货架、工具、门、液体、柔性物体和人类动作之间的关系。通用世界模型如果能提供更可靠的物理预测能力，将有助于机器人在训练、仿真、任务规划和异常恢复中减少试错成本。

在工业领域，世界模型也可能成为数字孪生和智能制造的新底座。传统工业仿真通常依赖明确规则、参数和工程模型，适合特定设备或流程，但跨场景迁移能力有限。通用世界基座模型如果能学习不同物理系统中的共同规律，未来可用于产线规划、设备状态推演、工艺参数优化、工业视频理解和安全风险预判。对于制造企业来说，这类模型的价值不只是“生成画面”，而是帮助系统提前判断某个动作、流程或环境变化会产生什么后果。

游戏和视频生成场景则提供了另一类验证路径。高质量内容生成需要画面真实，但更高级的生成需要物理过程连贯，比如人物动作、物体碰撞、光影变化、液体流动、机械运动和空间关系持续一致。Physis-v0.1如果能在这些场景中保持物理合理性，就能推动内容生产从短片段生成，向可交互、可控制、可持续演化的虚拟世界生成升级。这也会让世界模型同时服务数字内容产业和具身智能训练体系。

这次发布还有开源生态层面的含义。智源研究院长期围绕大模型、数据集、评测体系和开源技术底座推进建设，通用世界模型如果与开源数据、评测平台、智能体框架和基础软硬件生态联动，将有助于降低高校、研究机构和产业团队进入世界模型研究的门槛。对中国AI产业而言，基础模型能力需要头部团队突破，也需要开放生态让更多开发者围绕机器人、工业、科学研究和内容生成形成应用验证。

后续节点主要看三方面：一是悟界·Physis-v0.1是否开放模型、数据、接口或评测工具，让外部团队能够验证其物理一致性和泛化能力;二是机器人、工业、游戏和视频生成等场景中的试点应用是否形成可复现案例;三是悟界·Brainμ1.0等神经科学模型能否与世界模型体系形成更深连接，推动AI从语言和视觉智能，继续进入物理世界与生命科学交叉研究。若这些方向持续推进，智源研究院此次发布将不只是一次模型更新，而可能成为中国通用世界模型和具身智能底层技术体系建设的重要节点。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国