阿里ATH推出可实时交互世界模型HappyOyster
2026-06-21 10:19
收藏

维度网讯,阿里ATH推出可实时交互的开放式世界模型产品HappyOyster 1.0(快乐生蚝)。该产品能够构建并实时演化的数字世界,支持用户在生成环境中自由探索和交互,区别于市面上一次性的文生视频产品。

当前AI视频生成产品存在共性局限:用户输入描述后,模型渲染出的视频片段不可更改,且无法与画面内容互动。随着时长增加,画面容易出现角色形象不连贯、物体状态突变等问题。HappyOyster 1.0则致力于创建一个可演绎、可探索、可互动的数字世界,画面生成后用户可实时下达指令,世界据此反馈并持续演化。

该产品提供两种核心模式。Adventure模式为世界探索模式,用户可操控角色在生成的世界中移动、跳跃、攻击等。模型能根据场景内容自动匹配可玩的交互方式,例如场景中出现马车即可解锁骑马功能,出现汽车则可实现开关车灯、鸣笛等操作。

用户探索过程中可随时截屏留存画面,并保存世界后一键分享链接,他人可进入完整世界。Directing模式为实时导演模式,用户可输入指令引导剧情发展,并支持多模态参考,能锁定角色外观。该模式还具备回溯和剧情分支功能,用户可回退至前序节点,输入不同指令让剧情走向不同分支。官方还为产品提供了体验指南,帮助用户创建更好的世界。

HappyOyster 1.0的技术架构基于几项核心方法。该产品采用闭环世界状态建模技术,将当前世界状态压缩为隐状态摘要并在生成链路中递归传递,以此支撑长程生成的一致性。

为解决主体漂移问题,产品通过持久的参考表征参与全程注意力机制,为角色、物品等分配标识以保持身份稳定。其开放因果动作空间将动作指令与自然语言置于同一语义接口,模型能根据指令自动推演后续的连贯动作序列。在音视频协同方面,音频与视频在同一世界状态下联合解码生成,确保声画变化同步且符合物理规律。

目前,针对世界模型领域缺乏系统性评测基准的现状,HappyOyster团队正牵头与南京大学共建相关评测基准。产品已正式上线,可用手机号注册使用。官方还计划于近期开放API接口,未来可应用于游戏创作、短剧生成、文娱体验、数字人直播及虚拟陪伴等场景。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com