The iPhone’s Last Stand
TL;DR · AI 摘要
微软提出Project Solara,强调未来设备将作为云代理的门户,而苹果在AI领域面临挑战。
核心要点
- 微软的Project Solara设想设备作为云代理的门户,强调无本地计算的薄客户端模式。
- 苹果在AI领域表现尚可,但与微软相比仍存在差距。
- 微软通过演示展示其AI技术的实用性,而苹果的Siri AI仍需改进。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI与设备生态竞争
- 微软Project Solara
- 薄客户端模式
- 云代理交互
- 苹果Siri AI
- AI技术演示
- 与微软的差距
金句 / Highlights
值得收藏与分享的关键句。
The concept — which isn’t entirely clear from that video, but was more fully explained on stage — is that in the future you will be surrounded by an ecosystem of devices, none of which stand alone, bu
The point of an agent is not to use the computer for you; it’s to accomplish a specific task.
Apple, a company that can actually make devices, was under heavy scrutiny going into yesterday’s WWDC keynote for a different concern: can the company make AI?
iPhone的最后挣扎 – Stratechery by Ben Thompson
iPhone的最后挣扎
2026年6月9日,星期二
收听播客
收听这篇帖子:
登录以收听
多年来,苹果粉丝一直嘲笑微软喜欢谈论可能发货也可能不发货的产品,称其为“虚假宣传的软件”。然而,自从苹果在2024年拙劣地推出了Apple Intelligence和新的Siri之后,虚假宣传的软件变得可以接受,而且恰逢本文发布之时。
Project Solara
上周,在其年度Build开发者大会上,微软提出了一个名为Project Solara的新硬件设备生态系统愿景:
这个概念——从那部视频中并不完全清晰,但在舞台上得到了更详细的解释——是未来你将被一个设备生态系统所包围,这些设备彼此之间并不独立,更像是与你云端代理互动的门户。换句话说,正如我在二月份所写的那样,“Thin Is In”:
当你考虑到下一次人工智能浪潮时,这一点更加清晰:代理。代理的目的是不是为你使用计算机,而是完成特定的任务。至少在理论上,从请求到结果之间的所有内容都应该对用户是不可见的。这是将瘦客户端的概念推向极致的概念:你不仅不需要任何本地计算能力来从聊天机器人那里得到答案,而且也不需要任何本地计算能力来完成实际的工作。服务器上的AI将完成所有工作。
在那篇文章中,我提出了一个论点,即由于代理对内存需求的增加,服务器端推理将主导人工智能的工作负载。然而,我发现微软的虚假宣传产品令人着迷的地方在于,它展示了一个使用案例,其中这种瘦客户端方法由于KV缓存之外的原因而具有吸引力。
具体来说,在科技历史的大部分时间里,计算与交互是密不可分的;这就是为什么我们如此重视新的输入方法,因为它们经常引发新的范式转变。同样地,可穿戴设备作为iPhone之后的范式存在一个问题,就是与它们的交互通常很糟糕。当然,你可以想象一个未来,其中语音交互完全无缝,或者一个设备可以“看到”你所看到的,但任何超过几秒钟的交互都比在手机上滑动要不那么方便。然而,代理则代表你进行计算,无需任何交互:只需几秒钟,你就可以完成数小时的工作——至少在理论上是这样。
Siri AI
苹果是一家实际上能够制造设备的公司,在昨天的WWDC主题演讲之前,该公司受到了不同的关注:公司是否能够制造人工智能?如果以2024年6月人工智能的最新水平作为标准,当苹果第一次尝试回答这个问题时,他们做得相当不错。该公司预先录制的主题演讲非常努力地展示了实际的演示——包括旋转的指示器——而且它们确实有效!以下是苹果称之为“Siri AI”的第一个演示:
这个演示令人着迷的地方还在于,它也展示了苹果目前的落后程度。Siri 新负责人迈克·洛克韦尔成功使用 Siri 设置了一个提醒,用于参加演唱会门票的抽奖活动,这展示了 Siri 的上下文感知能力,以及通过苹果的 App Intents 框架与提醒事项应用进行交互的能力;而过去最先进的做法,可能是在时间到了时让 Siri 代表他进入抽奖。换句话说,这是在突破传统定义计算的交互范式之外进行操作,而苹果一直以来在这个领域占据主导地位。
与此同时,考虑到苹果在该市场中的地位和机会,苹果目前落后于前沿技术这一事实可能并不那么重要。首先,苹果的目标用户是消费者,对于他们来说,传统的聊天机器人功能可能已经足以满足绝大多数人工智能需求。Siri 可以为你提供食谱、提供 DIY 项目的建议,甚至生成图像。此外,Siri 对 iPhone 的访问权限,使其具备了与我最初对苹果智能感到乐观的相同优势。在 2024 年 6 月首次发布后的更新中提到:
这里最关键的部分是“理解个人上下文”:苹果智能将比其他任何 AI 都更了解你,因为你的手机比任何其他设备都更了解你(并且在你调用苹果智能时知道你正在看什么);由此可以推断出基础设施和隐私保护为何如此重要。这意味着苹果智能主要专注于那些利用这种知识的特定使用场景;这也就意味着苹果智能试图解决的问题空间是受到限制和明确界定的——无论是从字面意义上还是比喻意义上——都是 AI 出错可能性较低的领域。换句话说,苹果正在解决一个非常有用、只有他们才能解决、而且在声誉风险方面也相对“安全”的领域。说实话,这几乎显得不公平——或者说,这凸显了受信任平台所拥有的巨大优势。苹果可以在低风险的情况下以有意义的方式解决实际问题,而这正是他们正在做的事情。
实际上,苹果在这一版本的 Siri 上大大增强了其获取世界知识和生成图像的能力,这应该会使体验更加流畅;但真正的差异化将明显体现在对个人信息的访问上。你可以问 Siri 关于你收到的信息——是短信、电子邮件还是语音留言?——Siri 会真正找到你想要的内容;它还可以“看到”你在屏幕上查看的内容,并据此采取行动。此外,只要第三方应用向 Spotlight 语义索引提供数据,并通过 App Intents 提供操作,Siri 就可以以其他 AI 无法做到的方式(至少在本地 Mac 或 PC 上不做出重大安全妥协的情况下)跨不同服务进行操作。
消费者市场
这些功能确实非常有用,有很大可能目前已经足够,至少在现阶段是这样,这是因为消费者市场还有另一个值得关注的方面——除了数十亿消费者已经拥有 iPhone 之外,消费者本身并不想工作,也不太在意是否高效。
关于消费者市场的这一现实,是硅谷每隔几十年就必须重新学习的一课。以Dropbox为例,其创始人Drew Houston正在逐步卸任。Dropbox曾是一款开创性产品,拥有病毒式传播的钩子——如果有人使用你的推荐码注册,你就能获得更多的存储空间——并在消费者中迅速增长;但随后,公司花了太长时间试图在消费者市场中真正建立一个业务,直到最终意识到,最终这其实是一款提高生产力的产品,唯一能赚钱的方式是向企业销售。
当你思考这个问题时,原因显而易见:企业为其员工的时间付费,因此当然愿意为能提高员工生产力的工具付费;而消费者则大多只是想浪费时间,这正是为什么注意力收割型广告是唯一能在消费者服务领域大规模运作的软件商业模式。硅谷之所以会忘记这一点,是因为它本身就是一个泡沫;普通人并不在寻找能帮他们买演唱会门票的代理。
尽管如此,这个泡沫足以让OpenAI重复Dropbox所犯的同样错误:这家公司竟然说服自己,可以通过向消费者销售订阅服务赚到足够的钱;与此同时,Anthropic则意识到,真正愿意为AI带来的巨大生产力效益付费的是企业,而OpenAI却未能利用其在消费者市场的渗透,拒绝开发广告产品。
这其实是在说,我认为苹果在代理功能上的不足目前并不算什么大问题。代理功能可以帮助你完成工作并提高生产力,而消费者并不想工作,也不关心是否提高生产力。他们真正想做的事情是观看短视频,而iPhone在这方面比任何其他设备都做得更好;在这样的背景下,Siri只要足够好就足够了,而看起来苹果已经跨过了这道门槛。
iPhone的核心地位
实际上,苹果在重建Siri过程中涉及了许多有趣的细节,包括将Private Cloud Compute扩展到包含在谷歌数据中心运行的Nvidia芯片,以及一个拥有200亿参数的本地混合专家模型,该模型根据每个查询选择相应的专家(而不是每个token),以便在iPhone有限的内存中运行。
然而,这些实现细节的关键战略意义在于iPhone的核心地位。微软的Project Solara对微软来说显然是合理的,因为该公司错过了移动市场,但这也与人工智能的基础设施相契合,人工智能的基础设施位于云端,并且越来越多地涉及无需人类参与的计算。相比之下,苹果有强烈的动机去维护iPhone的重要性,进而专注于围绕人类交互的使用场景。
然而,将这些方法简化为对激励机制的愤世嫉俗的分析未免过于简单;它们在各自的领域都有其合理性。让我对Project Solara感到着迷的是,微软将其定位为纯粹的企业级方案,这一点非常重要,因为企业对正在进行的工作有背景信息,这使得构建长期运行的代理程序更加可行,而企业也愿意为此付费。对于消费者而言,要建立这样的背景信息将要困难得多,因为需要整合大量服务,才能获得一个连贯的数据集来进行操作。事实上,能够做到这一点的实体可能只有谷歌和苹果,分别通过安卓和iOS系统实现——而谷歌始终会更关注其云服务作为集成的焦点,而不是设备本身。
这使得苹果成为唯一一家真正——我敢这么说吗?——以不同方式思考的公司。没错,iPhone作为Siri真正的核心(Siri可以在你的所有设备上运行,但首先且最重要的差异化上下文信息来自你的iPhone),恰好与苹果的商业模式和不愿花费数十亿美元进行资本支出的意愿完美契合,但这并不意味着这种方法是错误的。你将能够在你的手机上访问其他公司所构建的全部资本支出,你只需使用一个应用即可;如果你需要查找个人内容,或在不同应用之间进行操作,Siri将是唯一能够做到这一点的助手——当然前提是它不是空头支票(看起来第二次尝试似乎奏效了)。
分享
- 在Facebook上分享(在新窗口中打开) [Facebook](链接)
- 在X上分享(在新窗口中打开) [X](链接)
- 在LinkedIn上分享(在新窗口中打开) [LinkedIn](链接)
- 通过电子邮件将链接发送给朋友(在新窗口中打开) [Email](链接)
←
2026.23: 权力转移