维度网讯,美国Anthropic于6月9日(当地时间)公开发布新AI模型「Claude Fable 5」。该模型被定位为该公司最高级别的「Mythos类」,首次向所有用户开放了此前未向公众提供的高水平能力,并同时配备了防止滥用的安全保护功能。
与此同时,该公司还向可信赖的合作伙伴限量提供了解除网络相关保护功能的高配版本「Claude Mythos 5」。

两个模型均以API模型名「claude-fable-5」等形式提供,价格为每100万输入token 10美元,每100万输出token 50美元。
「Fable」源自拉丁语「fabula」(被讲述的事物),与希腊语「mythos」是同义词。两个模型基于相同的基础模型,仅保护功能的有无不同,因此用含义相近的不同语言词汇来加以区分。
Fable 5从当日起即可在包括免费版在内的所有「Claude」套餐中使用。Pro/Max/Team/按座位计费的Enterprise订阅套餐在6月22日之前可免费使用,但6月23日之后需要使用积分。这是因需求难以预测而采取的分阶段提供方式,待提供能力完善后,将作为标准功能纳入。

API和按使用量计费的Enterprise套餐从首日起全面提供。另一方面,Mythos 5目前仅限于参与网络安全防御相关项目「Project Glasswing」的合作伙伴,并通过与美国政府合作的「可信访问计划」逐步扩大适用范围。面向生命科学领域的研究人员,还将另行设置解除生物和化学保护功能的Mythos类的提供框架。
Anthropic强调,Fable 5的图像识别能力大幅提升。作为演示,该公司发布了一段仅凭游戏画面截图就完整通关「宝可梦 火红」的视频,未提供任何地图、导航辅助或游戏内部状态信息。此前需要结合辅助工具组也难以完成的任务,Fable 5仅凭图像识别便成功通关。
根据Anthropic发布的系统卡,Fable 5的保护功能适用于网络安全、生物/化学、模型「蒸馏」相关用途,以及前沿LLM开发辅助用途。前三个领域在通知用户后将自动切换至「Claude Opus 4.8」,而前沿LLM开发用途的限制对用户不可见,且不会切换至其他模型。这是一种通过修改提示或微调来限制模型有效性的机制,预计受影响流量约占整体的0.03%,受影响组织占比低于0.1%。
此外,保护功能启动时的行为因使用环境而异。在Web、桌面和移动应用中,会自动回退至Opus 4.8并通知用户;但在Messages API中,默认情况下不会自动回退,而是以附带拒绝理由的方式阻止响应。开发者需要自行实现重试或回退处理,或者选择启用服务器端自动回退功能。
该公司还透露,在安全性评估中,Mythos 5的对齐能力与Opus 4.8大致相当,但在与用户关于自杀或自伤的对话中,部分回答有所倒退;在儿童安全相关的一些领域也存在改进空间。这些问题已通过「claude.ai」的系统提示更新基本解决,并将在未来的模型训练中加以反映。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









