The End of the AI Experiment: Surviving the CFO’s New ROI Demands

TL;DR · AI 摘要
文章探讨了AI支出不再仅仅是IT预算问题,而是涉及整个组织的资本分配纪律。CFO们现在要求AI投资产生可衡量的业务成果,而非单纯的实验。
核心要点
- AI支出已跨越部门界限,成为资本分配问题,而非简单的软件采购问题。
- 组织需要区分生产性消费和浪费性消费,以防止无节制的增长。
- 领导者应关注具体的AI工作流,而不是软件席位或部门预算,以便更好地控制成本。
结构提纲
按章节快速跳转。
AI支出不再仅仅是IT预算问题,而是涉及整个组织的资本分配纪律。
代币经济学是指AI使用的实际经济:如何将提示、自动化工作流和后台代理转化为真实支出,并判断这些支出是否产生了价值。
尽管单位价格下降,但消耗量增加导致总账单上升。
领导者应关注具体的AI工作流,而不是软件席位或部门预算,以便更好地控制成本。
支出上限在防止低价值使用无节制增长时有用,但在抑制最高效的工作时会适得其反。
领导者应询问谁定义有效结果,如何处理争议,以及供应商是否有激励最大化计费事件。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI支出管理
金句 / Highlights
值得收藏与分享的关键句。
AI支出已跨越部门界限,成为资本分配问题,而非简单的软件采购问题。
代币经济学是指AI使用的实际经济:如何将提示、自动化工作流和后台代理转化为真实支出,并判断这些支出是否产生了价值。
尽管单位价格下降,但消耗量增加导致总账单上升。
##### 为什么这已成为高管问题
为什么AI支出不再仅仅是IT预算问题? AI已经跨越了一个门槛,各部门的总支出需要资本分配纪律,而不仅仅是软件采购审查。每个部门现在都有理由进行AI投资,必须有人决定哪些请求值得持续资助。这一决策落在了首席财务官(CFO)身上,这意味着那些将AI提案视为功能请求的技术领导者将会失去资金,而能够展示可衡量业务成果的同行则会获得更多支持。
“代币经济学”和“代币最大化”实际上意味着什么?“代币经济学”简单来说就是AI使用的实际经济:提示、自动化工作流和后台代理如何转化为真实支出,以及这种支出是否产生了价值。“代币最大化”是指因为代币感觉便宜,或者高消耗的工作流看起来更高效,所以推动更多工作通过AI完成的习惯。这种直觉可能是合理的,但它造成了治理问题,因为组织需要一种方法来区分有生产力的消费和浪费的消费,而大多数组织尚未建立这种能力。
为什么AI账单在代币价格不断下降的情况下仍在攀升? 单位价格降低鼓励了更多的消费,而不是减少。随着代币变得更便宜,团队构建了更具野心的系统:更多自动化、更注重上下文、始终在线的代理在后台连续运行。任何单一查询的边际成本感觉微不足道,因此消费扩展以填满现有的预算。只关注谈判更低单位价格而忽视系统设计的组织会发现他们的总账单仍然在增加。
为什么CFO的审查正在加剧? 广泛的实验阶段即将结束。许多组织已经以某种形式部署了AI,但很少有人相信这些部署产生了切实的价值。一旦这个差距变得明显,财务团队就会停止将AI视为学习练习,并开始要求继续投资的证据。资金逻辑从支持大量松散定义的实验转变为集中资源在少数具有明确回报的工作流上。
##### 领导者应该真正治理的内容
控制的正确单位是什么:席位、团队、供应商还是工作流? 最有用的治理单位是个别应用程序或工作流,而不是软件席位或部门预算。AI成本是由使用模式产生的,而不是谁持有许可证。一个自动化的流程可以悄悄地消耗比几十个普通用户更多的代币。按工作流级别预算使管理者能够看到哪些用例在扩展,哪些超出预算,哪些应该重新设计或关闭。
什么时候支出上限有帮助,什么时候会适得其反? 当它们防止低价值使用的无节制增长时,尤其是当没有人能解释支出来源时,支出上限是有帮助的。当它们抑制最有效率的工作时,就会适得其反。如果你最高的消费团队也是表现最好的团队,那么一刀切的上限就是一种伪装成财务纪律的绩效税。正确的顺序是先衡量结果,然后再决定控制措施的位置。

当供应商提出基于成果定价时,领导者应该问什么? 基于成果的定价听起来很有吸引力,因为它似乎将供应商的激励与业务成果对齐。这种对齐并不是自动的。它完全取决于成果是如何定义的,成功是如何验证的,以及当系统产生某种触发收费的结果但没有创造实际价值时会发生什么。领导者应询问谁定义了有效的成果,如何处理争议,以及供应商是否有动机以偏离客户实际目标的方式最大化计费事件。
为什么不同的AI定价模型需要不同的治理方法? 并非所有的AI支出行为都相同。订阅定价购买了可预测性,但可以在固定费用中隐藏浪费。基于使用的定价使活动可见,但会产生波动的发票。基于成果的定价听起来更符合商业友好,但它可能掩盖了验证计费结果是否正确、完整且有价值的运营工作。向席位加消耗的转变增加了另一个复杂性:买家可能会续订熟悉的按席位合同,同时承担使用费用、信用、代理操作或成果费用,这些费用的行为非常不同。领导者需要与价值主张、成本发生和性能失败相匹配的治理。否则,他们可能会优化旧的定价模型,而他们的实际风险已经转移到其他地方。
席位不再是产品。越来越多地,它只是预付消费的包装。
当前最重要的治理差距是什么?
归因。大多数组织无法回答基本问题:哪些团队、工作流或代理消耗了多少代币,以及这种消耗支持了什么业务成果。缺乏这种可见性,所有其他治理机制,无论是限额、成本分摊还是 ROI 阈值,都基于不完整的信息运行。解决归因问题是其他一切的前提。
优秀的可见性基础设施到底应该是什么样的?
这意味着构建专用的仪表板,在接近实时的情况下显示每个工作流和每个代理的消耗情况,而不是月末才收到且无法追溯到具体决策或团队的成本发票。Salesforce 扩展了其内部的 Engineering 360 仪表板,以跟踪工作流和团队层面的人工智能使用情况,展示了公司通常需要定制的可见性工具,因为标准报告无法让领导者清楚地了解代币消耗、代理活动和采用模式。这是早期投资于自定义可观测性工具比等待供应商生态系统跟上的领域。

如何使代币消耗成为生产力信号,而不仅仅是成本指标?
高代币消耗与高质量输出往往相关。在设置任何控制之前,将代币支出连接到实际的业务成果:交易关闭、问题解决、代码发布、流失预防。一旦有了这个图景,加大对高相关性工作流的投资,并仔细审查其余部分。跳过这一步直接设定支出上限的组织可能会首先惩罚其最高效的团队。
#### 实用的治理机制
我们现在可以采取的最具操作性的治理步骤是什么?
为每个应用程序设置代币预算并设置自动警报阈值,并要求在任何新的人工智能功能发布之前进行成本影响评估。将此审查纳入冲刺计划中,而不是将其视为财务团队的后续事项。这将财务纪律嵌入开发过程,而不是在成本已经增加后才附加上去。
什么是 FinOps 实践,为什么它们对人工智能很重要?
FinOps 是通过工程、财务和业务团队之间的协作,将财务问责制带入技术支出的学科。应用于人工智能时,这意味着在项目启动前预测代币需求,为竞争性用例设置 ROI 批准门槛,并实施成本分摊,使业务部门承担其自身消耗的实际成本。特别是成本分摊机制为团队提供了真正的激励,让他们质疑自己的使用是否合理。
如果您的最高消耗团队也是表现最好的团队之一,那么一刀切的支出上限实际上是对绩效征税,伪装成财务纪律。
基础设施选择如何影响人工智能成本治理?
停止从成本角度来看待所有人工智能工作负载的等效性。公共云适合实验和突发容量,灵活性可以证明溢价是合理的。可预测的高容量推理工作负载更适合私有或本地基础设施,因为固定成本随着时间的推移会优于消费定价。将一切都默认为公共云会导致随着工作负载扩展而显著累积的溢价。
#### 采购和组织风险
我们的供应商合同仍然是按席位计费。这是个问题吗?
是的。按席位计费不再清晰地映射到人工智能系统生成的成本上。在许多人工智能密集型产品中,席位正在成为包含一定用量的基础层的包装,而不是总成本的可靠代理。每个提示、自动化工作流和后台代理都可以消耗代币,无论有多少人被授权,都会造成按席位预算无法预测的账单波动。推动结合可预测的基础费用和超出约定阈值的基于用量定价的混合模型,内置明确的价格上限、数量承诺、报告权和超额条款。
当席位变成消耗包时会发生什么变化?
许可证仍然重要,因为它控制访问权限,但它不再能充分反映成本。拥有相同数量席位的两个团队如果一个用于偶尔起草,另一个则在客户支持、软件开发或安全工作流中运行上下文丰富的代理,可能会产生非常不同的账单。因此,采购团队需要谈判包含的用量、超额费率、用量报告和对意外消耗的合同限制。购买问题从“多少人需要访问?”转变为“我们授权多少机器工作?”
代理型人工智能的治理成熟度差距是什么?
代理型人工智能指的是能够自主执行一系列动作而非响应单一提示的系统。这在经济上很重要,因为代理并不是自然的按席位用户。它执行任务、调用工具、消耗代币,并可能在人类离开后继续工作。研究表明,只有大约五分之一计划部署代理型人工智能的组织具备成熟的治理模型。如果没有明确的责任结构和绩效指标,组织会积累所谓的“内容债务”,即需要人工补救的人工智能生成的输出,侵蚀进一步投资的 ROI 案例。在扩展之前建立治理比在问题出现后进行改造要便宜得多。

我们应该如何构建 AI 成本治理框架以引起董事会的关注? 将其视为一种竞争风险,而不是预算管理问题。未受管控的 AI 资源消耗会随着时间的推移侵蚀利润率,并且那些能够良好管理 AI 经济的组织将在成本结构上比那些不能做到的组织具有竞争优势。代币正在成为一种真正的运营投入,对于那些打算认真扩展 AI 的组织来说,像对待能源采购或资本支出一样严格对待它们已不再是可选的。