Claude Fable 5 and Claude Mythos 5

TL;DR · AI 摘要
Anthropic 推出 Claude Fable 5 和 Claude Mythos 5,前者是安全可用的 Mythos 级模型,后者专为网络安全领域设计,两者均具备强大的 AI 能力。
核心要点
- Claude Fable 5 在软件工程、科学研发等领域表现卓越,且价格低于 Claude Mythos Preview。
- Claude Mythos 5 专为网络安全领域设计,通过 Project Glasswing 与美国政府合作部署。
- Fable 5 的安全机制会拦截约 5% 的请求,以防止潜在滥用。
结构提纲
按章节快速跳转。
介绍 Claude Fable 5 和 Claude Mythos 5 的发布背景和主要功能。
描述 Fable 5 在多个领域的能力,并解释其安全机制的设计。
介绍 Mythos 5 的部署方式及其在网络安全领域的应用。
说明 Fable 5 和 Mythos 5 的定价策略及 Anthropic 的目标。
展示 Fable 5 和 Mythos 5 在多个领域的能力测试结果。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Claude Fable 5 和 Claude Mythos 5
- Fable 5
- 能力领域:软件工程、科学研发、视觉、知识工作
- 安全机制:拦截约 5% 的请求
- 价格:$10/百万输入 token,$50/百万输出 token
- Mythos 5
- 部署方式:Project Glasswing 与美国政府合作
- 用途:网络安全领域
- 能力:全球最强的网络安全能力
金句 / Highlights
值得收藏与分享的关键句。
Fable 5 的能力在多个领域超越了 Anthropic 以往发布的所有模型。
Claude Mythos 5 是目前世界上网络安全能力最强的模型。
Fable 5 的安全机制会拦截约 5% 的请求,以防止潜在滥用。
Claude Fable 5 和 Claude Mythos 5 \ Anthropic
公告
Claude Fable 5 和 Claude Mythos 5
2026 年 6 月 9 日
今天,我们推出了 Claude Fable 5:一款经过安全处理的 Mythos 级别 1 模型,适用于一般用途。
Fable 5 的能力超过了我们以往发布的所有模型。在几乎所有测试的人工智能能力基准中,它都处于最前沿,表现出色,尤其在软件工程、知识工作、视觉、科学研究等多个领域。任务越长、越复杂,Fable 5 相比我们其他模型的优势就越明显。
发布如此强大的模型伴随着风险。如果没有防护措施,Fable 5 在网络安全等领域的强大能力可能会被滥用于造成严重损害。因此,我们推出了 Fable 5,并设置了防护措施,这意味着在某些话题上的查询将收到 Claude Opus 4.8 模型的回答。为了安全且快速地发布该模型,我们对这些防护措施进行了保守的调整——它们有时会误判无害的请求,但平均而言,触发频率低于 5%。随着未来几个月内更强大模型的推出,我们将尽快改进防护措施并减少误判。
对于一小部分网络安全防御者和基础设施提供商,我们还推出了 Claude Mythos 5。它与 Fable 5 使用的是同一底层模型,但在某些领域取消了防护措施。Mythos 5 最初将通过 Project Glasswing 项目部署,与美国政府合作,作为 Claude Mythos Preview 的升级版本。它是全球拥有最强网络安全能力的模型。不久之后,我们计划通过更广泛的可信访问计划扩大 Mythos 5 的访问权限。
Fable 5 和 Mythos 5 等模型的能力有潜力为世界带来深远的积极影响。我们在 Project Glasswing 中已看到这一潜力的初步体现,其中模型帮助网络安全防御者保护了关键重要的软件。我们也在生命科学研究中看到了这一点,其中模型提出了新颖的假设,并加快了新疗法的开发。
Fable 5 和 Mythos 5 的价格为每百万输入令牌 10 美元,每百万输出令牌 50 美元,不到 Claude Mythos Preview 的一半。今天的联合发布是我们在尽快且安全地将先进的 AI 能力带给尽可能多的用户方面迈出的又一步。
评估 Claude Fable 5 和 Claude Mythos 5
下表比较了 Fable 5 和 Mythos 5 与其他领先模型的能力。
Fable 5 和 Mythos 5 可以比以往任何 Claude 模型更长时间地自主运行。下面我们将讨论这些技能如何应用于软件工程,并介绍模型在知识工作、视觉、记忆和生命科学研究方面的改进能力。
软件工程。在早期测试中,Stripe 报告称 Fable 5 将数月的工程工作压缩到了几天内。在一个 5000 万行的 Ruby 代码库中,该模型在一个工作日内完成了整个代码库的迁移,而这项工作原本需要一个团队手工操作两个月以上。Fable 5 还比以往的 Claude 模型更节省令牌:在 Cognition 的 FrontierCode 评估中,该评估测试模型是否能在满足高质量生产代码库标准的同时通过困难的编码任务,Fable 5 在前沿模型中得分最高,即使在中等努力程度下也是如此。
知识工作。Fable 5 在复杂的分析任务中表现出色。在 Hebbia 的金融基准测试中,Fable 5 在高级推理任务中得分最高,尤其在基于文档的推理、图表和表格解释以及问题解决方面有显著提升。IMC 指出,Fable 5 在交易分析评估中几乎全面胜出,包括事实查找、概念推理、根本原因分析和预期价值分析。
视觉。Fable 5 是涉及视觉任务的新一代最先进模型。它可以从详细的科学图表中提取精确的数字,并能完成复杂的基于视觉的任务,例如仅凭截图重建网页应用的源代码。它还需要更少的辅助工具:例如,之前的 Claude 模型即使配备了额外的有用工具,也难以玩转 Pokémon FireRed,但 Fable 5 仅使用一个极简的视觉辅助工具就击败了 FireRed。
$!
/$
Claude 从头到尾仅使用原始游戏截图(没有地图、导航辅助或额外的游戏状态信息)玩 Pokémon FireRed 的延时摄影。
记忆与长上下文。Fable 5 在长时间任务中能够保持专注,并通过自己的笔记改进输出。当我们让模型玩卡牌构建游戏 Slay the Spire 时,给予其持久的基于文件的内存访问,其性能比 Opus 4.8 提升了三倍;Fable 5 还有三倍于 Opus 4.8 的机会进入游戏的最终阶段。
日食
Factorio
VibeCAD
带有古典 EDM 的流体
Claude Fable 5 构建了这个太阳系的模拟,首先从物理基本原理推导出行星的轨道运动,并利用它来预测日食。
Claude Fable 5 自主玩 Factorio,这是一款深受工程师喜爱的工厂建造游戏,它自行制定策略并建造自动化工厂。
Claude Fable 5 在基于浏览器的 CAD 编辑器中设计了一个完整的 3D 可打印模型。该编辑器本身也是由 Fable 5 创建的,包括内置的 AI 协作者,该协作者负责建模。
由 Claude Fable 5 编写的流体模拟,其运动与古典音乐 EDM 重混的节拍同步——Claude Fable 5 使用代码创作了这个 EDM 重混,此前从未听过音乐。
药物设计:通过使用我们的内部蛋白质设计专家 Mythos 5,药物设计过程的某些方面被加速了约十倍。在其中一个例子中,他们发现 Mythos 5 在没有人工协助的情况下,使用蛋白质设计和生物信息学工具,可以匹配甚至超越熟练的人类操作员的表现。通过这样做,该模型执行了科学家通常完成的所有任务:选择结合位点、选择并运行蛋白质设计工具,并在过程中从失败中恢复。这项研究中的 14 个蛋白质靶点中有 9 个(如下图所示)产生了用于药物设计的强候选物,我们目前正在对其进行研究。
由 Mythos 5 设计的蛋白质复合物。靶点包括免疫检查点、生长因子和受体信号传导、神经退行性疾病、肌肉疾病以及更难的结构靶点。
分子生物学中的新假说。Mythos 5 是我们首个能够持续生成新颖且引人注目的科学假说的模型。在与 Opus 级模型进行的盲测对比中,我们的科学家约 80% 的时间更倾向于 Mythos 的分子生物学假说,并已将其中几个推进到实验评估阶段。与此同时,一个 Mythos 假说——关于大肠杆菌蛋白的一种新机制——在一个独立研究同一问题的实验室的研究中得到了证实。
基因组学中的新研究。Mythos 5 在短短一周的大部分自主工作中开展了新颖的基因组学研究。它为跨越 138 种动物物种的数百万个细胞组装了单细胞数据,并设计并训练了一个定制的机器学习模型,用于识别在甚至关系较远的生物体中执行相同功能的细胞。仅在人类提供高层次输入的情况下,Mythos 5 训练的模型表现优于近期发表在《科学》期刊上的一款模型,尽管其规模小了 100 倍。我们计划在接下来的几个月内发表这些结果。
对齐性。在我们的自动化对齐性评估中,我们发现 Mythos 5 的行为偏差水平(包括模型采取的偏差行为,如欺骗,以及与用户滥用模型的协作)较低,且与 Opus 4.8 的相似。鉴于它们是同一底层模型,Fable 5 的对齐性水平也将类似。完整的评估以及详细的安全性和能力测试套件在模型的系统卡中均有描述。
我们自动化对齐性评估中总体的行为偏差水平。更多内容请参见系统卡的第 6.2.3.1 节。
对 Claude Fable 5 的早期反馈
拥有早期访问权限的客户对 Fable 5 进行了测试。以下是他们的一些反馈:
Claude Fable 5 是 CursorBench 上最先进的模型。它开启了以前无法触及的一类长期问题。
Claude Fable 5 是 GitHub 服务的开发人员真正向前迈进的一步。在我们的初步测试中,它以自主性和可靠性超越了之前的基准,承担了复杂、长期的编码任务。但最让我们兴奋的是它所指明的方向:一个开发者可以将越来越有雄心的任务交给代理,并在整个软件生命周期中信任结果的未来。
这是我们有机会测试的 Claude 模型中最强的结果。Claude Fable 5 在代理编码和原型设计方面明显向前迈进了一步。
Claude Fable 5 的推理能力明显超越了 Opus 4.8。它达到了高级研究科学家的水平——选择方向、分配资源、摒弃错误信念,并生成新颖的从第一原理出发的输出。
Claude Fable 5 理解构建者的意思,而不仅仅是他们输入的内容。过去需要一百次提示才能完成的应用,现在只需一次提示即可完成。当客户真的遇到瓶颈时,我们会求助于这个模型,以帮助他们迅速突破障碍,完成他们原本设定的目标。
Claude Fable 5 感觉上确实有显著的不同。在盲审中,我们的律师发现它的红线每次都能与或超越我们当前的模型。
在最高程度的努力下,Claude Fable 5 会反思并验证它自己的工作。对我们来说,这正是实现高度自主操作的关键——额外的思考是值得的。
Claude Fable 5 在更少的回合中实现了比之前模型更强大的工程能力 —— 能够处理我们员工每天在 Claude Code 中运行的复杂多代理工作流程。
Claude Fable 5 在 FrontierBench(Cognition 的前沿编码评估)中得分最高。它在长周期推理方面表现出色,并且能够开箱即用地推广到不熟悉的工具。
Claude Fable 5 是我们测试过的最强的以金融为主的模型,无论是在一般金融还是推理方面。这是一个显著的提升。
Claude Fable 5 是第一个在我们核心分析基准测试中得分超过 90% 的模型,该基准测试用于评估复杂且长期的分析任务 —— 比 Opus 高出 10 分。在最难的问题上,它表现出强烈的判断力和对细微之处的关注。
Claude Fable 5 是我们测试过的在前沿物理研究方面最强的模型,同时使用的推理令牌只有三分之一。在 36 小时内,它几乎达到了 GPT-5.5 在四天后达到的水平。
在我们的端到端 vibe-coding 基准测试 ViBench 上,Claude Fable 5 是我们测试过的性能最高的模型 —— 几乎完全满足我们的基本使用场景,并且在更少的时间和更少的令牌下构建了应用程序。
在我们的日常电子表格套件中,Claude Fable 5 在每个努力级别上都优于 Opus 4.8 —— 并且它在更少的回合中完成,运行速度提高了 25% 至 30%。
01
/
14
Claude Fable 5 的新安全措施
Mythos 级别的模型已经达到了一个阈值,它们带来了显著的风险。在四月,我们启动了 Project Glasswing,将第一个 Mythos 级别模型(Claude Mythos Preview)仅发布给一小部分网络安全防御者和关键软件基础设施提供商。当我们这样做时,我们表示希望最终能够将 Mythos 级别的能力发布给所有用户,只要我们开发出足够强大的新安全措施,以可靠地防止滥用。
在过去的几个月里,我们一直在改进这些安全措施,现在它们已经足够强大,可以进行一般发布。由于我们优先考虑安全性,我们特意将这些安全措施调整得更加谨慎,它们仍然比理想情况下的限制更严格 —— 例如,有时一些无害的请求会触发我们的分类器。我们认识到这会让一些用户感到沮丧,我们的目标是在发布后更新和改进这些安全措施,以减少误报。
下面我们将逐一讨论 Fable 5 的新安全措施。我们更广泛的安全措施套件在模型的系统卡和我们最新的风险报告中进行了讨论和评估。
安全分类器
Mythos 级别模型在前沿网络安全和研究生物学方面的能力意味着它们对恶意行为者构成重大升级风险。也就是说,这些模型可能会提供信息或建议,帮助这些行为者造成严重危害,而这些信息或建议是其他来源(例如互联网搜索引擎)无法提供的。此外,AI 模型的许多高级用法都是双重用途的:在网络安全专业人员和生物学家手中有益的查询,如果被恶意行为者获取,可能会变得危险。
因此,我们需要强有力的保障措施来防止滥用,而且这些保障措施的覆盖范围必须广泛。保障措施本身必须能够经受住持续且复杂的绕过尝试(也称为“越狱”系统)。Mythos级别的能力对许多对手来说具有很高的价值——例如,那些可能通过网络攻击获得经济利益的对手——因此,我们预计他们会受到激励,试图绕过我们的安全措施。
Fable 5引入了一套新的分类器:独立的人工智能系统,用于检测潜在的滥用行为,包括越狱尝试,并阻止主模型(在此情况下为Fable 5)作出回应。我们已经对模型运行分类器一段时间了,Fable 5的分类器是这项先前工作的扩展,具有更广泛的覆盖范围。
当Fable的分类器检测到与网络安全、生物学和化学或蒸馏相关的请求时,响应将自动由Claude Opus 4.8处理。每当发生这种情况时,用户将被通知。Opus 4.8本身是一个能力非常强大的模型:与Fable直接拒绝回应相比,退回到Opus的回应体验要好得多。我们的早期数据显示,超过95%的Fable会话根本没有触发任何回退——对于这些会话,Fable 5的表现实际上与Mythos 5相同。
分类器覆盖的领域包括:
- 网络安全。Mythos级别的模型在发现和利用软件漏洞方面表现出色。因此,它们可以使网络攻击更容易且成本更低。Mythos级别的模型在代理式黑客攻击方面也表现出强大的技能。这包括除了发现漏洞之外,执行网络攻击的多个不同部分——侦察、发现、横向移动等。为了防止这些代理式黑客技能在网络攻击中提供优势,我们设计了网络安全分类器,以更广泛的方式涵盖漏洞利用和进攻性网络任务。如下面的图表所示,我们的分类器阻止Fable在这些任务上取得任何进展。
在阻止响应模式下运行网络安全评估的结果,使用Fable 5。评估中未涉及尝试规避安全措施。
我们对分类器进行了广泛的红队测试,以测试其对越狱的鲁棒性。除了内部测试外,我们还运行了一个外部漏洞赏金计划,在超过1000小时的测试中没有发现任何通用的越狱方法。我们参与的外部红队组织在长篇幅的代理任务中也未能找到任何通用的越狱方法——尽管英国AISI在简短的初步测试窗口内已取得了一些进展。完全防止通用越狱可能是不可能的,但我们的目标是使任何剩余的越狱方法足够缓慢和昂贵,从而在它们被大规模使用之前被检测和阻止。
下面的图表来自我们的一项内部评估,展示了Fable 5的保障措施使其比我们之前的一般可访问模型更能抵抗越狱:
内部评估结果显示,一个自动化红队人员尝试在 400 次交互中使用模型完成与进攻性网络安全相关的简短任务,当被阻止时会重新启动并回退。这些任务大多较为简单,不能代表实际的网络使用情况,有时甚至只是在远程服务器上加密文件。对于更复杂且更贴近现实的任务,我们尚未在生产系统上观察到成功的越狱行为。请注意,Opus 4.6 并没有针对网络攻击的阻止机制。
我们的一位外部合作伙伴发现,Fable 5 在防止有害网络查询方面的安全措施是所有测试模型中(包括 Opus 4.8 和 Opus 4.7)最强大的。Fable 5 对所有与策划网络攻击、漏洞开发或防御规避相关的有害单次请求都完全遵守了零次。无论请求中是否使用了 30 种不同的公开越狱技术,这一结果都保持不变。
- 生物学和化学。我们长期以来一直使用分类器来阻止模型对一小部分与生物武器相关的查询做出回应。但现在我们不再确定仅阻止这一小部分就足够了。原因有两个:首先,我们担心资源充足的恶意行为者可能会利用我们的模型来提升其在高风险生物研究中的能力。其次,模型现在具备了更强的能力,可以完成现实世界中的科学任务。
例如,我们测试了 Mythos 5 在设计腺相关病毒(AAVs)过程中完成一项具有挑战性的步骤的能力。AAVs 是递送基因治疗的一种成分,但同样的能力如果落入错误的人手中,可能会被用于设计危险的病毒。在此次任务中,各种人工智能模型被评估其预测基因修改如何影响病毒外壳组装能力(在 Dyno Therapeutics 开发的一组具有治疗意义的未公开候选物中)。我们并未明确训练模型执行此任务,但 Mythos 系列模型仅凭其生物学推理能力,就优于专门用于蛋白质任务的复杂模型(称为“蛋白质语言模型”)。这表明模型在基因治疗研究和开发中完成简单但重要的任务方面具有令人鼓舞的能力,但也突显了这种双重用途能力所带来的风险。
评估结果显示,我们的模型预测了一种简单病毒的病毒外壳未公开的实验性质。在这一背景下,病毒外壳组装是预测最简单的病毒特性之一,但在设计更复杂的特性时,正确预测这一特性仍然非常重要。AAV = 腺相关病毒。
我们的首要任务是尽快安全地发布 Fable,即使这意味着需要采取过于广泛的防护措施。因此,目前我们已安排 Fable 在大多数与生物学和化学相关的请求上回退到 Opus 4.8。与我们所有的分类器一样,我们希望尽快缩小这些防护措施:从上述证据可以看出,Fable 在科学领域有巨大的潜在应用价值,我们不希望分类器的误报阻碍这一进程。在接下来的几周内,一些生物医学研究人员和公司将能够加入我们为 Mythos 5 的生物学能力设立的受信任访问计划(如下文所述)。
- 蒸馏。我们之前已经发现一些大规模尝试提取(“蒸馏”)Claude 能力的行为,目的是在一些专制国家训练竞争模型。对 Fable 5 能力的蒸馏可能间接导致接近前沿水平的 AI 能力扩散,而这些能力可能在缺乏适当安全措施的情况下被释放。被我们的分类器标记为属于此类蒸馏尝试的请求将回退到 Opus 4.8。
新的数据保留政策
最后,我们将对处理 Fable 5、Mythos 5 以及未来具有类似或更高能力水平模型的商业客户数据的方式进行调整。我们将要求对 Mythos 系列模型的所有流量(包括第一方和第三方界面)进行 30 天的数据保留。我们不会使用这些数据来训练新的 Claude 模型,也不会用于任何与安全无关的目的,并且我们已实施了新的隐私保护措施,包括记录所有对数据的人工访问,并在几乎所有情况下确保在 30 天后删除这些数据(详见此帖子的进一步细节)。这些数据将帮助我们防御复杂和新颖的攻击(包括新的越狱攻击和跨多个请求运行的攻击),同时也有助于我们识别和减少误报。
Claude Mythos 5 与可信访问计划
从今天开始,所有目前可以访问 Claude Mythos Preview 的用户(例如,Project Glasswing 项目中的网络安全合作伙伴)都将能够升级到 Claude Mythos 5。Mythos 5 与 Claude Fable 5 是同一模型,但去除了网络安全保护措施。在大多数情况下,用户会发现 Mythos 5 与 Mythos Preview 相当,或在某些方面更强,但成本却显著降低。
在与美国政府协商后,我们计划逐步扩大对 Claude Mythos 5 的访问权限,继续定期增加新的合作伙伴,并推行一个可信访问计划,使网络安全组织可以以更系统的方式申请访问。
我们的计划还包括为生物学领域开放一个可信访问计划,以帮助加速生物医学研究,并利用 Mythos 级别的能力发现新的疗法。该计划将提供访问 Fable 5 的权限,但去除了生物学和化学保护措施(但保留网络安全保护措施)。该计划将招募来自多个生命科学组织(涵盖基础研究和转化研究)的一小部分研究人员;我们计划在扩大该计划访问权限的同时,同时改进我们的保护措施。
可用性
Claude Fable 5 今天已在所有地区上线。Claude Mythos 5 目前仅限于 Glasswing 合作伙伴(已解除网络安全保护措施)和即将选择的生物学家(已解除生物学和化学保护措施),直到我们更广泛的可信访问计划上线。
两个模型的定价均为每百万个输入标记 10 美元,每百万个输出标记 50 美元。开发者可以通过 Claude API 使用 claude-fable-5。
我们预计 Fable 5 的需求将非常高,且难以预测。在 Claude API 和基于使用量的企业计划中,Fable 5 从今天起已全面上线。对于订阅计划,我们宁愿尽早提供访问权限,因此我们将采取更为保守、分阶段的方式推出:
- 从今天到 6 月 22 日,Fable 5 将免费包含在 Pro、Max、Team 和基于席位的企业计划中,无需额外费用。
- 6 月 23 日起,我们将从这些计划中移除 Fable 5。在此之后使用它将需要使用信用额度。如果容量允许,我们将延长包含窗口。
- 在此之后——当我们的容量足够时,我们希望将 Fable 5 恢复为订阅计划的标准组成部分。我们将尽快实现这一目标。
在此期间,我们会提前与用户沟通任何变更,让用户了解当前的进展。
编辑于 2026 年 6 月 9 日:更新了关于 AAVs 的讨论,指出这些候选者是由 Dyno Therapeutics 开发的。
#### 附注
- Mythos 级模型是 Claude 模型的一个层级,其能力位于我们 Opus 级之上。第一个 Mythos 级模型,Claude Mythos Preview,于 4 月通过 Project Glasswing 项目发布。今天,我们发布了 Claude Fable 5 和 Claude Mythos 5,紧随其后。
- Fable 源自拉丁语 fabula,意为“被讲述的事物”,类似于希腊语的 mythos。安全机制是区分这两个模型(Fable 和 Mythos)的关键原因,这也是我们为它们赋予不同名称的原因。
- 指标:Firefox = 实现任意代码执行的试验比例(利用的完全成功层级)。OSS-Fuzz = 五级评分的严重性加权平均(0.2 撞车 → 1.0 控制流劫持),因此数值是加权平均值,而非成功率。CyberGym = 重现目标漏洞的比例(公共排行榜指标)。CyScenarioBench = 成功率在所有挑战中平均计算。
- 通用越狱可以定义为任何允许用户与模型进行交互的提示、脚本或工具,就好像模型的安全机制不存在一样。这与仅在非常有限的情境中有效,或需要额外努力才能适应每种新情况的越狱形成对比。
相关内容
介绍 Claude 合作伙伴网络的服务轨道和合作伙伴中心
阅读更多
我们在绘制一年内 AI 驱动的网络威胁时学到的经验
随着 AI 改变了网络攻击的性质和方法,安全社区所使用的技术和框架的表现如何?在一份新报告中,我们试图回答这个问题。
扩展 Project Glasswing 项目
我们将 Project Glasswing 项目扩展到大约 150 个新组织,分布在 15 个国家以上。