Claude Fable 5 is now available on Databricks, fully governed through Unity AI Gateway
TL;DR · AI 摘要
Claude Fable 5 现已通过 Databricks 的 Unity AI Gateway 提供,支持企业级治理和多云部署。
核心要点
- Claude Fable 5 在 OfficeQA Pro 基准测试中达到 57.9% 的正确率,刷新了行业新高。
- 相比 Claude Opus 4.8,Fable 5 准确率提升 20%,但生成的输出令牌数量增加 2.5 倍。
- Databricks 通过 Unity AI Gateway 提供 Claude Fable 5,支持 AWS、Azure 和 Google Cloud 多云部署。
结构提纲
按章节快速跳转。
- §引言
Claude Fable 5 现已通过 Databricks 提供,支持企业级治理和多云部署。
Claude Fable 5 在 OfficeQA Pro 基准测试中达到 57.9% 的正确率,刷新了行业新高。
Fable 5 准确率比 Claude Opus 4.8 提升 20%,但生成的输出令牌数量增加 2.5 倍。
Databricks 通过 Unity AI Gateway 提供 Claude Fable 5,支持 AWS、Azure 和 Google Cloud 多云部署。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Claude Fable 5 的部署与性能
- 性能表现
- OfficeQA Pro 基准测试中达到 57.9% 正确率
- 准确率比 Claude Opus 4.8 提升 20%
- Databricks 部署支持
- 通过 Unity AI Gateway 提供
- 支持 AWS、Azure 和 Google Cloud 多云部署
金句 / Highlights
值得收藏与分享的关键句。
Claude Fable 5 在 OfficeQA Pro 基准测试中达到 57.9% 的正确率,刷新了行业新高。
Fable 5 是一个质量优先的模型,不是效率点。
Databricks 通过 Unity AI Gateway 提供 Claude Fable 5,支持 AWS、Azure 和 Google Cloud 多云部署。
Claude Fable 5 现已在 Databricks 上提供,通过 Unity AI Gateway 实现全面治理 | Databricks 博客
跳至主要内容
公告
2026 年 6 月 9 日
Claude Fable 5 现已在 Databricks 上提供,通过 Unity AI Gateway 实现全面治理
Anthropic 最具能力的通用可用模型用于自主知识工作,设定代理企业基准的新标准 —— 在接下来的一周内,将在 AWS、Azure 和 Google Cloud 上的 Databricks 上推出
作者:Ahmed Bilal、Ivan Zhou、Yash Oza、Gautam Venkatesh、Alice Li 和 Harish Gaur
摘要
Claude Fable 5 是 Anthropic 最智能的通用可用模型,现已在 Databricks 上提供。Claude Fable 5 在我们的内部基准测试中实现了最先进的性能,涵盖企业工作流程自动化、代理搜索、数据推理和多模态文档理解。Databricks 客户可以通过 Unity AI Gateway 访问 Claude Fable 5,实现集中治理、成本控制和可观测性。
Databricks 和 Anthropic 拥有相同的信念:最强大的 AI 是能够在您最困难的问题上、在您的数据上、在您的治理下工作的 AI。Claude Fable 5 —— Anthropic 有史以来最智能的模型 —— 现已在 Databricks 上提供,并将在接下来的一周内通过 Unity AI Gateway 在 AWS、Azure 和 Google Cloud 上推出。
Claude Fable 5 是一个 Mythos 级别的模型,专为以前对模型来说过于复杂、运行时间过长或过于模糊的问题而设计。现在,Fable 5 可以完成这些任务并更多;完成那些需要一个人花费数小时、数天甚至数周才能完成的端到端工作流程。
通过在 Databricks 上原生访问 Fable 5,您可以直接将其运行在您的企业数据上,将其连接到您现有的工具和工作流程,并在其基础上构建特定领域的代理,使用您组织在其他所有事情上依赖的治理方式。
在代理企业任务上的最先进水平
Claude Fable 5 专为长期自主性、复杂问题上的首次正确性以及跨并行子代理的可靠委托而设计。Databricks 在三个内部基准测试中评估了 Claude Fable 5,这些基准测试涵盖了企业面临的最困难的代理和文档 AI 任务。结果显而易见:Fable 5 是复杂、自主知识工作的质量领导者。
OfficeQA Pro —— SOTA
在我们的 OfficeQA Pro 基准测试中 —— 该基准测试在各自的代理框架中测试前沿模型在需要文件搜索、网络搜索、代码执行和多模态文档理解的困难文档问答任务上的表现 —— Claude Fable 5 实现了 57.9% 的正确率,创下了新的最先进水平。
与 Claude Opus 4.8 相比,Fable 5 的准确性提高了 20%,使用的工具调用减少了 12% —— 尽管它大约慢了 30%,并且每问题生成的输出令牌数量是前者的 2.5 倍。Fable 5 是一个以质量优先的模型,而不是一个效率点。
对于 Databricks 客户的 Claude Fable 5 新特性
Fable 5 的设计目标是能够独立走得更远:以更高的准确性和更少的人工干预来处理更长、更复杂的工作流程。以下是这对 Databricks 客户的实际意义。
- 企业工作流程的长期自主性:Fable 5 能够在较长时间内保持生产力输出,成功完成多天、目标导向的运行。对于 Databricks 客户来说,这意味着运行得更远、需要更少人工干预的 AI 驱动工作流程。
- 复杂问题的一次性正确性:早期测试者报告称,系统可以一次性实现,而之前需要几天的反复迭代。对于使用 Databricks 构建数据管道、分析工作流或 AI 应用的客户来说,这意味着更快的投产时间。
- 更强的代码审查和调查能力:与 Opus 4.8 相比,Fable 5 的错误发现率明显更高。故障排查、仓库历史调查和复杂调试也得到了显著改善,这使得 Fable 5 成为 Databricks 上工程团队的强有力选择。
- 可靠地委托给并行子代理:与之前的模型相比,Fable 5 在调度和维持并行子代理方面更加可靠,这对于基于 Databricks Agent Bricks 构建的复杂代理工作流来说是一项关键能力。
- 高质量的视觉识别:Fable 5 对密集的技术图像、网页应用和详细截图的解读比之前模型准确得多,这使得 Databricks 上的文档 AI 和多模态工作流更加丰富。
通过 Unity AI Gateway 安全访问 Claude Fable 5
Fable 5 可通过 Unity AI Gateway 通过统一的 API 和 Messages API 端点进行访问,与其他所有 Databricks 模型保持一致。管理员可以控制哪些用户、团队和服务主体可以调用它,并且可以进行细粒度的权限管理。每次请求和响应都会记录到 Unity Catalog 中,为组织内的所有使用情况提供完整且可查询的审计跟踪。由于接口是标准化的,因此无需更改应用程序代码即可将 Fable 5 替换为其他模型。
按照代理自主性扩展防护措施
Fable 5 的设计是能够端到端地完成工作,而不仅仅是响应单个提示。它可以运行数小时,协调并行子代理,并在工具和系统之间执行操作,几乎不需要人工干预。这种程度的自主性使其具有很高的价值,而基础设施中的治理措施则让团队有信心在大规模部署它。Databricks 提供了两层控制。
- 对每个 LLM 调用应用防护措施。Unity AI Gateway 在模型看到提示之前和在响应到达用户之前对每个请求执行防护措施,阻止 PII、越狱尝试、不安全内容以及您定义的自定义业务特定规则。每个操作都会通过推理表记录到 Delta 中。
- 将防护措施扩展到每个工具调用。Unity AI Gateway 服务策略在每个工具调用执行之前进行评估,例如完全阻止 delete_file,仅允许管理员执行 drop_table,或在任何写入操作之前要求明确的同意。无论结果如何,每个操作都会记录到 Delta 表中。
在大规模上跟踪和优化 Fable 5 的使用成本
Fable 5 的长期运行消耗的令牌数量显著多于典型的模型调用,而 AI 工作负载可能会以传统云预算工具无法检测到的方式失败。Unity AI Gateway 中的 AI 使用成本控制功能允许平台团队按用户、使用场景、工作区和账户设置阈值,并在达到限制之前触发警报。成本分析仪表板按模型、提供商、工作区和用户分解支出,使团队在采用规模扩大时拥有全面的可见性。
构建特定领域、长期运行的代理
通过 Agent Bricks,团队可以在 Fable 5 上构建特定于其业务领域的智能体 —— 这些智能体基于自身的数据,连接到自身的工具,并且随着时间推移在其实际工作流程中进行评估和优化。这正是 Fable 5 的能力转化为为特定业务量身定制的解决方案的地方。
构建完成后,智能体将作为 Databricks Apps 部署:完全托管、无服务器、内置认证、访问控制以及 Lakebase 驱动的内存,使智能体能够在会话之间保持上下文。最终结果是一个基于最强大模型运行的特定领域智能体,连接到您的数据,遵循您的策略,并部署在您组织已经信任的基础设施上。
为安全保留数据
鉴于模型能力的提升,我们遵循 Anthropic 对 Fable 5 模型的新数据保留政策,该政策包括仅出于信任和安全目的的 30 天数据保留(详见 Anthropic 官方博客中具体的数据保留政策)。
在 Databricks 上开始使用 Claude Fable 5
Claude Fable 5 现在已在 Databricks 上推出,通过 Databricks Marketplace 和 Unity AI Gateway,覆盖 AWS、Azure 和 Google Cloud。
- 在 AI Playground 中试用 Fable 5:现在可在 Databricks Marketplace 上使用
- 配置 Unity AI Gateway:在您的 Databricks 工作区中设置治理、成本控制和回退机制
- 探索 Agent Bricks:在 Databricks 上构建由 Fable 5 驱动的长期自主智能体
- 联系您的账户团队:获取企业访问权限、安全分类器指导或从 Opus 4.8 迁移支持
订阅最新文章
订阅我们的博客,将最新文章发送到您的邮箱。
注册
查看所有博客
slice-start id="_gatsby-scripts-1"
slice-end id="_gatsby-scripts-1"