未来推理将吃掉70%算力，30%留给训练丨硅谷投资人张璐@AIGC2026

量子位

量子位2026年5月24日

未来推理将吃掉70%算力，30%留给训练丨硅谷投资人张璐@AIGC2026

8.7内容质量

TL;DR · AI 摘要

未来AI算力将由推理主导，占比达70%，通信能耗是数据中心最大瓶颈，物理AI发展需依赖高质量真实数据。

核心要点

推理算力需求将占总算力70%，超过训练成为核心优化方向
数据中心通信能耗可能是计算本身的百倍以上
物理AI发展瓶颈在于真实世界高质量数据稀缺

结构提纲

按章节快速跳转。

§AI算力重心转移
推理算力需求将从当前50%上升至70%，成为AI基础设施核心优化目标。
·通信能耗问题
数据中心通信环节耗电量可能比计算本身高出百倍，光学通信技术价值凸显。
›物理AI发展瓶颈
物理AI面临架构和算力成熟但缺乏高质量真实数据的问题。
§数据质量优先
医疗等行业因数据质量高而成为AI重点布局方向。
·产业整合加速
企业AI预算从千万级跃升至数十亿级，采购周期压缩至一两个月。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

AI算力未来趋势
- 推理主导
  - 占比70%
  - 可持续需求
- 通信瓶颈
  - 能耗百倍于计算
  - 光学通信突破
- 物理AI
  - 数据层瓶颈
  - 真实数据稀缺

金句 / Highlights

值得收藏与分享的关键句。

推理算力需求将占总算力70%，超过训练成为核心优化方向。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X
数据中心通信环节整体耗电量可能比计算的耗电量要大几十倍甚至上百倍。
— 第 5 段
⬇︎ 下载 PNG 𝕏 分享到 X
物理AI现在卡在数据层：架构和算力都已具备，真正的瓶颈是缺乏足够高质量的真实世界数据。
— 第 4 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI算力#数据中心#物理AI#数据质量#通信技术

打开原文

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

2026-05-24 14:14:05 来源：量子位

技术创新只是起点，产业整合速度才是AI落地的真正竞争力

编辑部整理自 AIGC2026
量子位 | 公众号 QbitAI

从硅谷投资人的视角望出去，AI的叙事正在悄然换轨。

在这个新旧周期交替的关键节点，Fusion Fund创始合伙人张璐带来了她一线的判断：

过去两年，行业所有的目光都聚焦在模型和算力上，但真正的战场，正在向基础设施的“通信层”和物理世界的“数据层”转移。

在本次2026中国AIGC产业峰会上，她将这一轮AI叙事的转向说得很直白——

推理将超越训练，成为算力消耗的新主角；而数据中心里那个鲜少被提及的通信环节，其耗电量可能是计算本身的百倍以上。

至于下一个真正值得押注的方向，在她看来，并非更大的模型，而是更真实、更高质量的数据，以及医疗、太空、纳米机器人这三个AI应用方向。

为了完整体现张璐的思考，在不改变原意的基础上，量子位对演讲内容进行了翻译和编辑整理，希望能给你带来更多启发。

2026中国AIGC产业峰会是由量子位主办的行业峰会，近20位产业代表与会讨论。线下参会观众超千人，线上直播观众近400万，获得了主流媒体的广泛关注与报道。

核心观点梳理

算力需求的重心正在从训练转向推理：训练是一次性的算力投入，推理才是可持续的长期需求；随着智能体交互替代对话交互，推理算力的比重将从现在的50%继续攀升，成为AI基础设施最核心的优化方向；
数据中心的真正电老虎是通信：在AI数据中心内，通信消耗的电量可能比计算本身高出百倍，这意味着光学通信等新一代通信技术的价值，远比通常认知的更为关键；
物理AI现在卡在数据层：架构和算力都已具备，真正的瓶颈是缺乏足够高质量的真实世界数据；合成数据可以作为补充，但无法替代边缘场景中的真实采集；
数据的质量比数量更重要，而医疗恰恰是高质量数据密度最高的行业之一：这是大量AI科技公司在2025年集中入局医疗赛道的底层逻辑，而不只是因为它市场够大；
技术创新只是起点，产业整合速度才是AI落地的真正竞争力：当500强企业的AI预算从千万级跃升至数十亿级，采购周期从半年压缩到一两个月，这种加速度本身就是模型和应用持续迭代的燃料。

以下为张璐演讲原文：

AI叙事的新拐点

大家好，我是张璐，我是硅谷Fusion Fund的创始和管理合伙人。

在过去的十到十一年的时间里，我们一直专注北美市场早期科技公司的投资，尤其专注在三个领域——企业级人工智能、医疗AI以及工业自动化。

过去两年，大家可能都关注到了，硅谷经历了快速迭代的创新周期，尤其是以人工智能为驱动的快速的产业创新以及产业植入的进程。

所以我们在过去这两年非常辛苦，但也非常兴奋，看到了很多杰出的企业家、创业者快速地成长起来，也看到了产业中从人工智能、基础设施，再到人工智能的应用层面上多重创新的开展和发展。

到今年，我觉得已经进入到了一个新时期，可以看到人工智能在整体的叙事上、创新的专注层面上，有了一些新变化。

所以今天也非常高兴有机会和大家分享，过去一年我们看到的硅谷新兴的人工智能创新风向的变化，以及一些最新的动态。

过去几年，我们在聊到人工智能创新的时候，有几个关键词反复出现，比如大语言模型、生成式AI、训练、算力需求等等。

但最近这段时间，我们看到在语境层面上也有一些新的转向，比如，不只是在讨论大语言模型，现在更多在讨论行业专属应用，基于的是小语言模型怎么样可以通过更加低成本、高效的方式，去进行产业垂直人工智能的植入，另外也是模型对象的转变。

从语言模型，现在更多讨论的是物理AI，还有世界模型的调整。

同时在计算层面，我们也经常讲到人工智能的算力需求非常巨大，以前算力的大量消耗可能是在训练端。

但过去这段时间，大家更多讨论的是推理对于算力的需求会越来越大，甚至超过训练，成为长期可持续的算力需求。

在根本层面上，我们也能看到有越来越多对于数据的讨论，从最早我们经常讲规模定律（Scaling Law），认为有越多的数据意味着可以去训练出更好的人工智能模型。

到现在大家更多关注数据的质量——怎么样可以拿到高质量的行业数据？怎么可以通过高质量的行业数据去做更好的数据库？我们称之为数据治理（data curation），还有数据图书馆（data library）。

再基于这些数据的质量去优化人工智能，无论是模型能力，还是在应用能力上进行迭代。

重新定义AI基础设施

今天也想根据这些不同的方向，跟大家快速分享几个我们非常看好、而且现在正快速发展的人工智能领域。

首先要跟大家分享和聊到的就是人工智能基础设施。

如果大家有关注英伟达3月的GTC大会，也能看到英伟达的叙事在改变，以前讲的是一家GPU芯片企业，到现在黄仁勋已经非常明确——

英伟达是一个人工智能基础设施公司，一个人工智能工厂。

从Token经济学来看，未来对人工智能基础设施的需求，可能就像对电力的需求一样常见，这是一场非常巨大的基础层级的产业革命。

所以我们看到，对于人工智能基础设施的创新需求非常高。人工智能现在进入了产业部署阶段，大规模的产业部署也需要非常强力的人工智能基础设施来辅助和支持。

现在有大量新建的人工智能数据中心，它们面临很多挑战，比如电力的消耗、通信层面上的能量消耗，还有各种各样技术问题。

所以怎么样在这个层面上进行更多的技术创新，也带来了很多的创新机会，其中我们聊得比较多的，就是基础设施本身的算力优化。

我刚才提到，核心的算力变化在于——以前算力关注更多的是训练本身，但现在我们看到一个非常清晰的转变：训练更多是一次性的算力投入，但是推理是可持续的算力需求。

几年前，这两个层面上对算力的需求——训练的算力需求占到70%以上，推理可能只有20%到30%，现在推理已经占到了一半，在未来可能会变成30:70（训练:推理）。

尤其我们现在已经到了新的转变阶段，即从聊天对话这种交互方式，到现在智能体的交互。如果你有一个智能体，你是不是希望这个智能体一直在线，一直响应你？

这个过程中对于推理的需求就更加具有可持续性，然后也更加大量，这个过程中推理所消耗的算力也更为核心。

因此，怎样进行推理的优化？怎样进行推理算力的优化？是未来人工智能基础设施要去解决的核心问题之一。

我们刚才主要专注的是说计算这部分的算力，在人工智能基础设施层面上大家探讨的，更多是在计算过程中消耗了多大的能量。

现在全世界都在讨论，人工智能的核心发展瓶颈之一就是耗电量，但是在计算之后，下一步是什么呢？是通信（Communication）。

这个通信的过程中有通信能力的需求，有内部通信，还有交换机（switch）的需求，在人工智能的数据中心里，通信环节整体的耗电量可能比计算的耗电量要大几十倍甚至上百倍。

我去年有幸在斯坦福，和我们之前的老校长，也是谷歌的母公司Alphabet的董事会主席John Hennessy做过一个对话，在对话中他专门提到——

在通信的过程中所消耗的电量可能比计算本身要超过百倍以上。

CPU、GPU的设计思路，其实是尽量在本地、在芯片本身做尽量多的计算，而不是去进行更多的传输，你可以把计算到处部署，也可以把数据到处挪动，但是挪动数据的过程中它消耗的电量，比移动计算本身的成本更高。

所以这也催生了很多新技术，它们所关注的正是通信的部分——怎么样可以有新一代的通信技术？我们经常提到，现在有很多新创新是在光学通信层面上，去大规模降低通信过程中的能量消耗，这也是很关键的。

我们刚才也提到一个转变，就是从语言模型→世界模型→物理AI。

到物理AI，我们所应用到的数据不只是文本数据，还有很多三维的数据、真实世界的数据，而这些数据的量级也更加巨大。

在这个过程中如果你再去到处传输数据，它对于能量的消耗也会更加巨大。

这也是为什么我们在这个领域会看到更多创新。

物理AI的突围：边缘计算与新型传感器

刚才我提到了好多次“物理AI”。

物理AI现在也是一个新兴发展的方向，它不只是我们经常讲的人形机器人。

物理AI，它其实涉及到了仿真模拟（simulation），还有数据层、世界模型等领域，这些都覆盖到物理世界和AI的交互。无论是大家可能关注比较多的无人驾驶，还是工厂领域高精度生产的整体物理AI的投放和使用，还有医疗、物流供应链、太空行业等等，都在大规模应用物理AI。

怎么样可以让物理世界和AI更好地互动？这也是现在创新很重要的方向。

我们看到很多创新其实聚焦在一个是仿真模拟层，另一个就是数据层。

现在对于物理AI来讲，最大的一个瓶颈，是我们的架构做好了，也有算力，但现在最缺的就是数据，现在最大的瓶颈也是在数据。

我们没有足够高质量的真实世界数据去支持物理AI的模型训练，当然这个过程中有很多人去聊一个相关方向，就是合成数据。

合成数据现在也是发展速度很快的一个方向，包括通过合成数据再去看去支持仿真模拟，但在这个过程中会发现，合成数据其实存在很多弊端或者盲点。

所以，对真实世界中边缘场景、边缘数据的收集，还是非常关键的。

这也就意味着，我们不只是要去关注模型层的技术发展，要更努力去投入新型的数据收集平台和数据优化平台的技术创新，这样才可以有更好的数据库，去支持物理AI进一步的发展。

既然物理AI现在核心的一个痛点，就是它的数据层。那怎么样可以获得真实世界和工业界的高质量数据？

这个时候你会发现，比如传统的制造生产行业，它其实产生了很多高质量的真实三维数据，但是它的痛点在于，没有一个非常好的数据收集平台去进行标准化的数据收集、数据优化和数据治理（curation），让数据整体达到可以进行人工智能模型训练的阶段。

而在这个过程中，因为很多真实世界的需求，应用场景又对这样的数据收集平台的消耗，有着天然的限制。

所以怎样可以在边缘端更好进行人工智能的部署，也是非常重要的一个方向。

在这里我提到一个新的技术，就是我们看到了很多年一直在发展的人工皮肤，它核心是柔性电路，叫Flexible Electronics。

△来自斯坦福大学官网

今年出现了很多这样的公司，其中做得最好的研究之一，是来自斯坦福大学鲍哲南教授的实验室，他们所做的人工皮肤的传感器，是一款高精度、低能耗的传感器，它可以薄到就像手套一样，无论是套在机械手上，或者套在人的手上，它的触觉有非常高精度的传感点，这个触觉数据，就可以成为非常重要的数据来源，去支持物理世界。

△援引自中国科学院学部

在这个过程中，我们不只看到初创企业在做新型的数据收集平台。

我们在和一些500强企业，尤其是一些500强的制造龙头企业对话的时候，我发现他们自己内部也在做这方面技术的探索，所以说大家其实意识到了核心的瓶颈是在数据层，也有更多的创新聚焦到数据这一层。

我还想再强调一点，就是边缘计算。

边缘计算未来的发展也会非常快，这个方向对我们来说已经不是新方向了，我们从2018、2019年就开始投资边缘计算。

在过去两年，我觉得产业形成了一个共识——人工智能发展的未来方向是在边缘端的人工智能部署。

怎么样能够达到边缘端人工智能的部署？又回到我们刚才涉及到的问题，它需要的是一个小模型。

比如说我们今年有一家公司刚被高通收购，他们的模型就可以小到——不足10亿token，在这样的情况下，你可以在一个Raspberry Pi（树莓派）上面去运行这个小模型，它就可以有和GPT-4同等的人工智能能力。

包括前段时间，谷歌发布的一些开源模型，也有一些非常小的边缘模型，所以在边缘端的人工智能铺设非常重要。

而边缘端AI的铺设，再和新型的数据收集平台整合到一起，我们就可以在边缘端进行数据收集、本地化处理和本地化的人工智能的应用，所以对于高监管行业，还有那些对数据隐私相对敏感的行业来说，都是非常好的发展方向。

关注三个应用方向：医疗、太空与比细胞还小的机器人

最后，跟大家讲几个我非常看好的具体人工智能应用方向。

今年对于硅谷来讲是人工智能医疗领域非常重要的一年，在年初的时候，先是礼来（美国制药公司）和英伟达成了一个10亿美金的合作。

△来自英伟达官网

他们的合作不只是人工智能和医疗的结合，他们也希望构建一个人工智能+医疗+数据技术的生态，去帮助更多的初创企业跟他们达成战略合作，我们有好几家公司跟他们在进行合作。

包括在1月份，大家可能有关注到，无论是ChatGPT还是Claude，都发布了针对医疗领域应用的专属产品，尤其是Claude做的Claude for Health，其实是专注底层的基础设施，在数据、隐私、安全，还有合规层面上去帮助医疗领域的服务提供商和医院等等，更好地进行AI医疗的整合。

前一段时间，大概几周前，默克（美国的制药企业，世界上最大的制药企业之一）也和谷歌Gemini发布了非常重磅的战略合作。所以我们会看到，很多人工智能的科技企业都在纷纷入局医疗领域。

医疗领域不只是美国市场最大的市场之一（美国20%的GDP都在医疗领域），更重要的一点，是我们刚才提到的很重要的一个转变，或者说共识——大家意识到数据的质量比数据的量更重要。

哪个行业有海量的高质量数据？其中一个很重要的行业就是医疗领域。

2017年我们就开始发布AI医疗的报告，去年又做了一个最新版，可以看到很多新的进化。

到现在，我们会看到很多新型的AI医疗公司，它专注的是一个垂直领域小模型。

比如说专门针对细胞疗法做一个垂直AI模型，针对MRA（磁共振血管造影）的测序数据专门做一个垂直模型，甚至还有一些是针对特定疾病的，比如说专门针对帕金森、老年痴呆，去结合各种各样的数据、生物信息学进行个性化的诊断和治疗。

这个过程中，不只是AI模型，还有包括机器人和物理AI也在医疗领域进行大规模的铺设。

这里我提到一家公司叫Medra，也是我们去年刚投资的一家公司。

他们是斯坦福背景的团队，做了整一套的物理AI系统，从AI层面上可以自己去理解怎么样进行生物医疗的实验设计，同时进行机械手臂、还有自动化机器人实验，到最后整体去自动化整个生命科学，包括医疗领域的科研过程。

几周前，他们刚刚在旧金山，开启了他们全球现在最大的一个全无人物理AI机器人的实验室，现在正在昼夜不停进行各种各样的实验搭设。

这家公司在早期的时候就和很多药厂合作，所以现在我们去聊AI医疗，已经不是几年前单纯的问诊、医生辅助功能，现在已经涉及到了非常核心的个性化治疗部分。

个性化治疗也不只是我们之前可能看得比较多的癌症、心脑血管疾病，现在尤其是脑部疾病，例如帕金森、老年痴呆、抑郁症，这些都可以和AI、甚至物理AI进行深度整合。

另外一个我个人非常看好的方向就是——物理AI和太空科技的结合，尤其是未来3-5年整个太空领域的发展，太空经济学、太空生态、太空基础设施的崛起都会非常快速。

当然大家现在都在关注马上要到来的SpaceX的IPO，这也是非常强大的信号，会让大家看到接下来的三五年整个太空经济的快速崛起，又因为太空生态的特殊性，它就有天然的AI原生和机器人原生的特性。

比如说我们会讲到太空基础设施的搭设，在这个过程中就会用到很多物理AI，还有机器人的创新应用，同时包括未来一个很大的发展方向，就是太空工厂。

当然你可以运送人上去太空工厂，但是可能更好的选择是在短期内运送机器人上去。比如现在探月的任务，你会发现在人类进行登月的尝试之前，会部署很多的机器人和机械设备。

我们自己也有投资专门做太空基础设施的公司，尤其是机器人层面上的应用，去进行这种效能提升。

例如太空加油站，所有设备都已经做好了，而且在过去的这一年时间就已经达到了上亿美元的订单收入。所以这个产业的快速迭代发展，也是一个非常新兴的、迭代非常迅速的人工智能创新方向。

最后一个方向其实也跟医疗相关，但它需要一定时间去成熟、但会让大家觉得非常兴奋的方向——

就是以更小的维度去看机器人的发展，我们叫它微米机器人或者纳米机器人。

更小的机器人可以进到人类的血管里，比如说去清除血栓；或者更进一步缩小到DNA级别，去进行靶向药物递送，实现体内的免疫隐形。

现在有越来越多的技术在这个方向进行迭代，比如说进行血栓清除的微米机器人，已经进入商业化应用的初始阶段。包括DNA引擎、Nanoswimmer（纳米机器人领域的一个细分形态，指会游泳的纳米级机器人），还有靶向递药的这些纳米机器人的应用，在未来几年也会有很好的前景和快速的发展。

所以今天就和大家快速地分享一些在过去这一年多的时间里，我们看到的一些让人很兴奋的AI发展方向。

现在整个生态也处在迭代期，还有很多新的模型架构在涌现。

当然这个过程中整个AI生态也面临很多挑战，但对于创业者来讲，挑战就意味着机会，所以我们会看到更多优秀的创业者，跳到产业里去开展新方向的探索。

作为投资人我们也非常幸福，我觉得现在对早期的AI的投资人来说，是很幸福的时刻，可以看到这么多的技术，不仅是处在创新的阶段，还处在产业快速迭代的时代。

最后想跟大家分享的就是，除了技术创新之外，现在更重要的一个时间节点，就是从今年开始我们会看到产业对于技术整合的态度在快速变化。

我们看到大量500强企业在人工智能方面的预算，从几千万变到几亿，甚至变到了几十亿。从以前销售周期可能需要半年甚至更长的时间，到现在一个月、两个月的时间，这种产业的快速整合才是人工智能技术能够快速发展的核心竞争力。

因为只有到达真实的应用场景，快速获得用户，或者说得到应用场景的反馈，获得高质量的产业数据，才可以让我们的模型架构和应用不断迭代。

所以也非常期待接下来这一年会有更多新的创新出现，也欢迎大家有时间可以多来硅谷，进行更多技术层面上的交流，谢谢。