GitHub Slashes Agent Workflow Token Spend up to 62% with Daily Audits and MCP Pruning

TL;DR · AI 摘要
GitHub通过每日审计和MCP修剪策略,成功将Agent工作流令牌支出降低高达62%。
核心要点
- GitHub通过每日审计发现并优化了Agent工作流中的冗余令牌使用。
- MCP修剪策略帮助GitHub减少了不必要的计算资源消耗,节省成本。
- 优化后,GitHub的Agent工作流效率提升,同时保持了系统的稳定性和安全性。
结构提纲
按章节快速跳转。
GitHub通过优化策略显著降低Agent工作流的令牌支出。
每日审计帮助识别和优化冗余的令牌使用。
MCP修剪策略减少计算资源消耗,提升成本效益。
优化后,GitHub的Agent工作流效率和成本效益显著提升。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- GitHub Agent Workflow Optimization
金句 / Highlights
值得收藏与分享的关键句。
GitHub通过每日审计和MCP修剪策略,成功将Agent工作流令牌支出降低高达62%。
每日审计帮助GitHub识别并优化了Agent工作流中的冗余令牌使用。
MCP修剪策略减少了不必要的计算资源消耗,从而显著降低了成本。
GitHub 通过每日审计和 MCP 修剪将代理工作流令牌支出削减高达 62% - InfoQ
您对本网站使用 Cookie 的选择
我们使用 Cookie 来优化网站功能并为您提供最佳的体验。
我接受 我不接受 设置
[BT](https://www.infoq.com/int/bt/ "bt")
InfoQ 软件架构师通讯
每月为您总结作为架构师或未来架构师需要了解的重要信息。
输入您的电子邮件地址
选择您的国家/地区 - [x] 我同意 InfoQ.com 按照此 隐私声明 处理我的数据。
关闭
实时网络研讨会和 Q&A:在 AI 分析时代重新思考日志 (2026年7月9日)保留您的席位
关闭
切换导航
促进专业软件开发中的知识和创新传播
英文版
[为 InfoQ 撰稿](https://www.infoq.com/write-for-infoq/ "为 InfoQ 撰稿")
搜索
解锁完整的 InfoQ 体验
通过登录解锁完整的 InfoQ 体验!随时关注您喜爱的作者和主题,与内容互动,并下载独家资源。
或
没有 InfoQ 账户?
- 随时了解对您重要的主题和同行接收最新见解和趋势的即时通知。
- 快速访问免费资源以实现持续学习迷你书、带字幕的视频和培训材料。
- 保存文章并随时阅读收藏文章以在您准备好的时候阅读。
主题
[开发](https://www.infoq.com/development/ "开发")
- [Java](https://www.infoq.com/java/ "Java")
- [Kotlin](https://www.infoq.com/kotlin/ "Kotlin")
- [.Net](https://www.infoq.com/dotnet/ ".Net")
- [C#](https://www.infoq.com/c_sharp/ "C#")
- [Swift](https://www.infoq.com/swift/ "Swift")
- [Go](https://www.infoq.com/golang/ "Go")
- [Rust](https://www.infoq.com/rust/ "Rust")
- [JavaScript](https://www.infoq.com/javascript/ "JavaScript")
开发中的精选内容
Dany Lepage 讨论了将一款热门 VR 游戏移植到七个非 VR 平台的架构之旅。他解释了团队如何解决跨平台进度同步、多样化的输入模式以及在 Steam、iOS 和 PlayStation 上保持发布速度的挑战。除了技术层面,他还分享了将沉浸式社交体验转化为 2D 屏幕时的“产品适配”差距的坦率教训。

开发中的所有内容关注主题
[架构与设计](https://www.infoq.com/architecture-design/ "架构与设计")
- [架构](https://www.infoq.com/architecture/ "架构")
- [企业架构](https://www.infoq.com/enterprise-architecture/ "企业架构")
- [可扩展性/性能](https://www.infoq.com/performance-scalability/ "可扩展性/性能")
- [设计](https://www.infoq.com/design/ "设计")
- [案例研究](https://www.infoq.com/Case_Study/ "案例研究")
- [微服务](https://www.infoq.com/microservices/ "微服务")
- [服务网格](https://www.infoq.com/servicemesh/ "服务网格")
- [模式](https://www.infoq.com/DesignPattern/ "模式")
- [安全](https://www.infoq.com/Security/ "安全")
架构与设计中的精选内容
Michael Stiefel 与 Baruch Sadogursky 讨论了代理 AI 时代的软件架构。大型语言模型(LLM)可以以概率方式作为推理机器,能够解释人类的模糊性。通过提供适当的严格上下文工件来控制 LLM 的推理,软件规范可以成为事实的来源,而代码则成为一种可丢弃的中间语言。

架构与设计中的所有内容关注主题
[AI 基础设施](https://www.infoq.com/ai-ml-data-eng/ "AI 基础设施")
- [大数据](https://www.infoq.com/bigdata/ "Big Data")
- [机器学习](https://www.infoq.com/machinelearning/ "Machine Learning")
- [NoSQL](https://www.infoq.com/nosql/ "NoSQL")
- [数据库](https://www.infoq.com/database/ "Database")
- [数据分析](https://www.infoq.com/data-analytics/ "Data Analytics")
- [流处理](https://www.infoq.com/streaming/ "Streaming")
AI、机器学习与数据工程精选
- #### 构建AI采用的评估体系:从原则到实践
Mallika Rao 通过她在 Twitter、Walmart 和 Netflix 的经验,探讨了生产 AI 系统中隐藏的评估债务风险。她解释了为什么传统指标无法适应现代架构,详细介绍了涵盖基础设施和用户体验的五层评估堆栈,并分享了一个诊断成熟度模型,帮助工程领导者消除无声的语义故障。

所有 AI-ML 数据工程内容关注主题
[文化与方法](https://www.infoq.com/culture-methods/ "Culture & Methods")
- [敏捷](https://www.infoq.com/agile/ "Agile")
- [多样性](https://www.infoq.com/diversity/ "Diversity")
- [领导力](https://www.infoq.com/leadership/ "Leadership")
- [精益/看板](https://www.infoq.com/lean/ "Lean/Kanban")
- [个人成长](https://www.infoq.com/personal-growth/ "Personal Growth")
- [Scrum](https://www.infoq.com/scrum/ "Scrum")
- [社会协作](https://www.infoq.com/sociocracy/ "Sociocracy")
- [软件工艺](https://www.infoq.com/software_craftsmanship/ "Software Craftmanship")
- [团队协作](https://www.infoq.com/team-collaboration/ "Team Collaboration")
- [测试](https://www.infoq.com/testing/ "Testing")
- [用户体验 (UX)](https://www.infoq.com/ux/ "UX")
文化与方法精选
Trisha Ballakur 以她的初创公司 Pointz 为案例,分享了她从后端软件工程师成长为 CTO 和 CEO 的旅程。她解释了如何通过自下而上的客户发现找到产品市场契合点,如何有效委派全球承包商以缩短开发时间,如何定制像 Valhalla 这样的开源存储库,以及如何将工程测试用例模型应用于业务开发。

所有文化与方法内容关注主题
- [基础设施](https://www.infoq.com/infrastructure/ "Infrastructure")
- [持续交付](https://www.infoq.com/continuous_delivery/ "Continuous Delivery")
- [自动化](https://www.infoq.com/automation/ "Automation")
- [容器](https://www.infoq.com/containers/ "Containers")
- [云](https://www.infoq.com/cloud-computing/ "Cloud")
- [可观测性](https://www.infoq.com/observability/ "Observability")
DevOps 精选
- #### GPU 工作负载的实时与批量处理
Joseph Stein 讨论了在私有云数据中心内构建企业级 AI 即服务平台的工程实践。他解释了如何通过多命名空间调度最大化未充分利用的 GPU 池,如何利用 Valkey 和 Lua 实现原子优先级排队和背压管理,如何通过集中代理网关缓解 OWASP Top 10 LLM 风险,以及如何使用自定义 S3 到 Kafka 代理扩展批量管道。

所有 DevOps 内容关注主题
[活动](https://events.infoq.com/ "Events")
有用链接
- [关于 InfoQ](https://www.infoq.com/about-infoq "About InfoQ")
- [InfoQ 编辑团队](https://www.infoq.com/infoq-editors "InfoQ Editors")
- [为 InfoQ 写作](https://www.infoq.com/write-for-infoq "Write for InfoQ")
- [关于 C4Media](https://c4media.com/ "About C4Media")
- [多样性](https://c4media.com/diversity "Diversity")
选择您的语言

[InfoQ 首页](https://www.infoq.com/ "InfoQ 首页")[新闻](https://www.infoq.com/news "新闻")GitHub 通过每日审计和 MCP 修剪将代理工作流令牌支出削减高达 62%
[DevOps](https://www.infoq.com/Devops/ "DevOps")
在线 InfoQ 架构师认证 (6 月 10 日):改变你思维方式的同行对话。
GitHub 通过每日审计和 MCP 修剪将代理工作流令牌支出削减高达 62%
2026 年 5 月 29 日 2 分钟阅读
作者
- Mark Silvester
平台与架构经理
#### 为 InfoQ 撰稿
满足你的好奇心。帮助全球 550k+ 高级开发人员
每月保持领先。联系我们
登录以收听本文
加载音频
0:00 0:00
Normal 1.25x 1.5x
喜欢
GitHub 已发布结果,展示了其在自身存储库中运行的代理工作流中削减令牌使用量的工作。通过修剪未使用的模型上下文协议(MCP)工具、用 GitHub CLI 调用替换 MCP 调用以及添加每日审计和优化代理,GitHub 实现了高达 62% 的成本削减。
这项工作对任何在持续集成(CI)中运行大型语言模型(LLM)代理的团队都至关重要,因为计划任务会在无形中累积成本。GitHub 将每个代理调用通过 API 代理路由,并为每次运行生成一个 token-usage.jsonl 文件,该文件以统一格式记录 Claude CLI、Copilot CLI 和 Codex CLI 的输入、输出和缓存令牌。
为了跨模型层级进行比较,团队使用了有效令牌(ET)指标,该指标将输出令牌权重设为 4×,缓存读取权重设为 0.1×,并应用模型乘数(Haiku 为 0.25×,Sonnet 为 1.0×,Opus 为 5.0×)。无论使用何种模型,10% 的 ET 降低都对应 10% 的成本减少。
两个代理工作流驱动了优化循环。每日令牌使用审计器汇总按工作流的消耗情况,标记异常运行,并显示最昂贵的任务。当审计器突出显示某个工作流时,每日令牌优化器会读取源代码和最近的日志,打开一个 GitHub 问题,并提出具体的修复建议。这两个代理本身也会出现在每日报告中。
优化器发现的最常见的低效问题是未使用的 MCP 工具。由于 LLM API 是无状态的,代理运行时会在每次请求中包含工具模式,因此一个包含 40 个工具的 GitHub MCP 服务器每轮可能增加 10 到 15 KB 的模式数据。移除未使用的条目后,GitHub 的烟雾测试工作流中每次调用的上下文减少了 8 到 12 KB。团队还用 gh CLI 命令替换了用于获取拉取请求差异和文件内容的 MCP 调用,这些命令要么在代理启动前预下载到工作区文件中,要么通过透明 HTTP 代理在运行时代理,从而避免将身份验证令牌暴露给代理。
在十几个生产工作流中,Auto-Triage Issues 在 109 次修复后的运行中实现了持续 62% 的 ET 减少,Security Guard 减少了 43%,Smoke Claude 减少了 59%。Daily Community Attribution 提高了 37%。一个工作流 Contribution Check 记录了 5% 的 ET 增加,GitHub 将其归因于更大的拉取请求工作负载增加,而非性能退化。
团队还指出了 MCP 剪枝的局限性。每日社区归属分析中包含了八个未使用的 GitHub MCP 工具,在整个运行过程中这些工具没有被调用过一次,但移除它们并未减少执行时间(ET)。“工具清单只是该工作流整体上下文中的一小部分,”GitHub 写道。
Anthropic 和 OpenAI 均提供了提示缓存功能,而 LangChain 则为代理运行提供了基于回调的令牌跟踪功能。GitHub 的贡献在于审计与优化循环,它将代理级别的可观测性与能够提交问题的优化代理相结合。Auditor 和 Optimiser 已经包含在 gh-aw CLI 中。
“最便宜的 LLM 调用是你没有进行的调用,”GitHub 写道,将下一步定义为组合级别的分析,旨在针对存储库中工作流舰队的重复读取和共享中间产物进行优化。
关于作者

#### Mark Silvester
Mark Silvester 是 Griffiths Waite 的平台与架构经理,这是一家位于英国伯明翰的软件咨询公司。他负责平台战略,专注于为企业客户提供创新解决方案。他的兴趣领域包括云原生技术、DevOps 实践以及 AI 在工程和架构中的实际应用。
显示更多 显示更少
#### 本内容属于 DevOps 专题
关注专题
##### 相关专题:
关注者:4108
关注专题
关注者:10246
关注专题
关注者:5078
关注专题
关注者:5927
关注专题
关注者:19
关注专题
关注者:40
关注专题
关注者:41
关注专题
关注者:37
关注专题
* #### 相关编辑推荐
- ##### GitHub 推出自主修复漏洞的 AI 代理原型
* #### 相关赞助商
- ##### MCP 内部:AI 集成协议
- #### 相关赞助商
Copilots 让单个开发者更高效。WaveMaker 让 10 个团队保持一致性。
通过技能水平的差异实现架构治理和可预测的结果。[尝试 WaveMaker AI](https://www.infoq.com/url/f/10c51022-82f6-4310-b490-1c30e1aa4774/).
相关内容
2026年5月12日
2026年5月5日
2026年5月15日
2026年5月26日
- Icon##### 架构自主性:组织内部的去中心化架构
2026年5月15日 
2026年5月27日
2026年5月22日
2026年5月21日
2026年5月18日
相关赞助商
- #### 直接从 UI 交付应用。尝试 WaveMaker Design-to-Code。使用您自己的设计系统扩展生产规模。
WaveMaker 的微服务平台将 AI 与现代前端、后端、移动和 DevOps 技术集成,快速构建或增强企业级云原生应用。从设计开始创建像素级完美的应用。了解更多。
- #### 无混乱地采用 AI —— 在您的应用内工作的开发代理,遵循您的架构并保持每个决策的可追溯性。
企业团队在扩展开发规模时常常失去控制和透明度。了解 WaveMaker Studio 中的专用开发代理如何加速 Web 和移动构建,同时确保每个决策均可审查、可逆且完全属于您。
- 赞助商

相关内容
2026年5月15日
2026年5月14日
2026年5月13日
2026年5月11日
2026年5月8日
2026年5月7日
**InfoQ** 时事通讯
每周二发送的 InfoQ 上周内容汇总,加入超过 250,000 名高级开发者的社区。查看示例
输入您的电子邮件地址
选择您的国家 - [x] 我同意 InfoQ.com 根据此 隐私声明 处理我的数据。
- ##### [Pip 26.1 发布依赖冷却功能和实验性锁定文件支持以应对供应链攻击](https://www.infoq.com/news/2026/05/pip-261-dependency-cooldowns/ "Pip 26.1 发布依赖冷却功能和实验性锁定文件支持以应对供应链攻击")
- ##### [Cloudflare 和 Stripe 允许 AI 代理创建账户、购买域名并部署到生产环境](https://www.infoq.com/news/2026/05/cloudflare-stripe-agent-commerce/ "Cloudflare 和 Stripe 允许 AI 代理创建账户、购买域名并部署到生产环境")
- ##### [Google 推出 Cloud Fraud Defense 作为 reCAPTCHA 的继任者](https://www.infoq.com/news/2026/05/cloud-fraud-defense-recaptcha/ "Google 推出 Cloud Fraud Defense 作为 reCAPTCHA 的继任者")
- ##### [LinkedIn 如何识别导致系统反复冻结的内核锁竞争问题](https://www.infoq.com/news/2026/05/linkedin-kernel-lock-freeze/ "LinkedIn 如何识别导致系统反复冻结的内核锁竞争问题")
- ##### [Uber 使用实时信号和列表排序改进餐厅推荐](https://www.infoq.com/news/2026/05/uber-eats-ranking-system/ "Uber 使用实时信号和列表排序改进餐厅推荐")
- ##### [设计大规模工程支持的多代理系统:Grab 的案例研究](https://www.infoq.com/news/2026/05/grab-multi-agent-support-system/ "设计大规模工程支持的多代理系统:Grab 的案例研究")
- ##### [从创始工程师到 CTO 再到 CEO —— 在同一家初创公司](https://www.infoq.com/presentations/framework-best-practices-startup/ "从创始工程师到 CTO 再到 CEO —— 在同一家初创公司")
- ##### [AI 的目标是问责制,欧盟法规支持透明度](https://www.infoq.com/news/2026/05/accountability-AI-EU-regulations/ "AI 的目标是问责制,欧盟法规支持透明度")
- ##### [从遗留系统到主权:通过平台工程驱动保险业的未来](https://www.infoq.com/presentations/insurance-platform-engineering/ "从遗留系统到主权:通过平台工程驱动保险业的未来")
- ##### [构建 AI 推广评估:从原则到实践](https://www.infoq.com/presentations/eval-ai-adoption/ "构建 AI 推广评估:从原则到实践")
- ##### [设计可靠的 AI 平台:用于确定性的工具,用于探索的代理](https://www.infoq.com/presentations/ai-platforms-reliability/ "设计可靠的 AI 平台:用于确定性的工具,用于探索的代理")
- ##### [Sarang Kulkarni 分享构建生产环境中的深度研究代理的经验教训](https://www.infoq.com/news/2026/05/kulkarni-deep-research-agents/ "Sarang Kulkarni 分享构建生产环境中的深度研究代理的经验教训")
- ##### [AI 辅助迁移工具帮助团队在几分钟内从 ingress-nginx 迁移到 Higress](https://www.infoq.com/news/2026/05/ai-nginx-higress/ "AI 辅助迁移工具帮助团队在几分钟内从 ingress-nginx 迁移到 Higress")
- ##### [GitHub 通过每日审计和 MCP 修剪将代理工作流令牌支出削减高达 62%](https://www.infoq.com/news/2026/05/github-agentic-token-savings/ "GitHub 通过每日审计和 MCP 修剪将代理工作流令牌支出削减高达 62%")
- ##### [Platform Engineering Labs 扩展 formae,增加 Kubernetes 支持和原生 Helm 集成](https://www.infoq.com/news/2026/05/formae-k8s-helm-integration/ "Platform Engineering Labs 扩展 formae,增加 Kubernetes 支持和原生 Helm 集成")
**InfoQ** 时事通讯
每周二发送的 InfoQ 上周内容汇总。加入超过 250,000 名高级开发者的社区。查看示例
- 快速了解在各种创新者和早期采用者技术上发布的内容
- 学习你不知道的未知知识
- 保持与你感兴趣的领域的最新信息同步
输入您的电子邮件地址
选择您的国家 - [x] 我同意 InfoQ.com 按照此 隐私声明 处理我的数据。
[首页](https://www.infoq.com/ "首页")[创建账户](https://www.infoq.com/reginit.action "创建账户")登录[QCon 大会](http://qconferences.com/ "QCon 大会")活动[为 InfoQ 写作](https://www.infoq.com/write-for-infoq/ "为 InfoQ 写作")[InfoQ 编辑](https://www.infoq.com/infoq-editors/ "InfoQ 编辑")[关于 InfoQ](https://www.infoq.com/about-infoq/ "关于 InfoQ")[关于 C4Media](https://c4media.com/ "关于 C4Media")[媒体工具包](https://get.infoq.com/infoq-mediakit/ "媒体工具包")[InfoQ 开发者营销博客](https://devmarketing.c4media.com/?utm_source=infoq "InfoQ 开发者营销博客")[多样性](https://c4media.com/diversity "多样性")
#### 活动
- ##### InfoQ 在线架构师认证
2026年6月10日
- ##### InfoQ 在线组织架构师认证
2026年6月19日
- ##### InfoQ 在线AI工程认证
2026年7月25日
- ##### QCon 旧金山
2026年11月16-20日
- ##### QCon 伦敦 2027
2027年4月13-16日
#### 关注我们
Youtube 232K 订阅者Linkedin 26K 订阅者Instagram 新RSS 19K 阅读者X 57.1k 订阅者Facebook 21K 点赞Bluesky 新
#### 保持更新
InfoQ 播客工程文化播客软件架构师通讯
通用反馈 [feedback@infoq.com](mailto:feedback@infoq.com) 广告 [sales@infoq.com](mailto:sales@infoq.com) 编辑 [editors@infoq.com](mailto:editors@infoq.com) 市场营销 [marketing@infoq.com](mailto:marketing@infoq.com)
InfoQ.com 及所有内容版权 © 2006-2026 C4Media Inc.
关闭
[BT](https://www.infoq.com/int/bt/ "bt")