在 @augmentcode ，我们对我们的 AI 架构做出了反直觉的赌注。

Augment Code(@augmentcode)

Augment Code(@augmentcode)2026年5月12日

在 @augmentcode ，我们对我们的 AI 架构做出了反直觉的赌注。

8.5内容质量

TL;DR · AI 摘要

Augment Code 使用 Mercury 2 作为专用子代理，实现了 82% 的上下文压缩速度提升和 90% 的摘要成本降低。

核心要点

使用 Mercury 2 作为专用子代理，上下文压缩速度提升了 82%。
摘要成本降低了 90%，工具搜索摘要时间缩短至小于 1 秒。
通过 Prism 路由降低了 30% 的 LLM 开销。

结构提纲

按章节快速跳转。

§引言
Augment Code 在 AI 架构上做出了反直觉的决策。
·架构决策
使用 Mercury 2 作为专用子代理，而不是使用主编码模型来保留 KV 缓存。
·用户收益
用户获得了 82% 更快的上下文压缩速度和 90% 更低的摘要成本。
·其他收益
工具搜索摘要时间缩短至小于 1 秒，LLM 开销降低了 30%。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

AI 架构
- Mercury 2
  - 82% 上下文压缩速度提升
  - 90% 摘要成本降低
- Prism 路由
  - 30% LLM 开销降低

金句 / Highlights

值得收藏与分享的关键句。

使用 Mercury 2 作为专用子代理，实现了 82% 的上下文压缩速度提升。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
摘要成本降低了 90%，工具搜索摘要时间缩短至小于 1 秒。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
通过 Prism 路由降低了 30% 的 LLM 开销。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI 架构#Mercury 2#Inception Labs

打开原文

在 X 上增强代码："在 @augmentcode ，我们对我们的 AI 架构做出了一个反直觉的赌注。我们没有使用主要的编码模型来保存 KV 缓存（行业标准），而是使用了 @_inception_ai 的 Mercury 2 作为专用子代理。

用户收益：上下文压缩速度提高了 82%"

来源 URL：https://x.com/augmentcode/status/2054241239885844714

Markdown 内容：

在

，我们对我们的 AI 架构做出了一个反直觉的赌注。我们没有使用主要的编码模型来保存 KV 缓存（行业标准），而是使用了 @_inception_ai 的 Mercury 2 作为专用子代理。用户的收益：上下文压缩速度提高了 82%，摘要成本降低了 90%，工具搜索摘要时间小于 1 秒，通过 Prism 路由降低了 30% 的 LLM 开支。阅读完整故事：inceptionlabs.ai/blog/rise-of-r

引用

Inception

@_inception_ai

10小时前

@augmentcode 重新构建了他们的上下文压缩层，围绕 Mercury 2 进行。延迟减少了 82%，成本减少了 90%，质量与 Opus 4.7 相当。今天已在生产环境中运行。“我们做了一个反直觉的赌注。我们将摘要完全解耦，并将其卸载到 Mercury 2 作为专用