Claude Dispatch and the Power of Interfaces

TL;DR · AI 摘要
专门设计的AI界面如Claude Code更适合程序员。
核心要点
- 聊天机器人界面导致认知负担过重,影响工作效率。
- 专门设计的AI界面如Claude Code更适合程序员。
- Google的Stitch和Pomelli展示了未来AI工具可能的设计方向。
结构提纲
按章节快速跳转。
- §引言
AI工具的界面设计对工作效率有显著影响。
聊天机器人界面导致认知负担过重,影响工作效率。
专门设计的AI界面如Claude Code更适合程序员。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI工具的界面设计
金句 / Highlights
值得收藏与分享的关键句。
人们在工作中使用AI时会付出认知税,因为AI提供的信息量过大。
专门设计的AI界面如Claude Code更适合程序员,而非开发人员。
Google的Stitch和Pomelli展示了未来AI工具可能的设计方向。
标题: Claude Dispatch 和接口的力量
来源网址: https://www.oneusefulthing.org/p/claude-dispatch-and-the-power-of
发布时间: 2026-03-31T22:34:37+00:00
Markdown 内容: AI 已经远远超出了大多数人所意识到的能力范围。所谓的“能力过剩”很大程度上并不是因为 AI 的局限性(尽管它们仍然有很多局限),而是因为人们与之交互的方式。大多数人通过聊天机器人访问 AI,而且通常是使用功能较弱的免费版本。聊天机器人对于快速提问很好用,但并不是完成实际工作的有效方式。
事实上,最近的研究表明,我们在工作中使用聊天机器人界面时会付出认知上的代价。一篇新论文[1]让一组金融专业人士使用 GPT-4 进行复杂的估值任务,并从转录记录中逐回合测量他们的认知负荷。人们确实从使用 AI 中看到了生产力的提升,但部分提升似乎被 AI 呈现信息的方式所抵消:大量的文本墙、提出新的主题建议以及冗长的讨论。聊天机器人的界面似乎是障碍,而不是工作本身。一旦对话变得混乱,就会一直混乱下去。AI 为了提供帮助而优化,只是反映了用户提供的无序结构,而用户在压力下没有重新组织。双方都在不断加剧问题。受到最大影响的是经验较少的工人,这些人本可以从 AI 中受益最多……如果他们能够跟踪自己是如何使用它的。

如果你曾经使用过聊天机器人来完成任务,这应该不会让你感到惊讶。你问了一个具体的问题,却得到了五段包含答案的文本(在某处!),同时 AI 还提供了三个你没有询问的新内容。界面本身造成了认知成本,超过了 AI 智能带来的好处。那么更好的界面是什么样的呢?
一种选择是为特定的工作或任务构建特定的界面。在所有专门的 AI 界面中,唯一真正完整的只有编程界面。这正是你所期望的,AI 实验室由程序员组成,模型经过大量代码训练,而开发这些工具的人通常也是为自己开发的。
我之前写过关于 Anthropic 的编程代理 Claude Code,它可以自主工作数小时。OpenAI 的 Codex 和 Google 的 Antigravity 也做类似的事情。我使用 Claude Code 从赚取少量收入到制作游戏,完全不需要接触任何代码。我也发现 Codex 非常有用,具有类似的水平。这些工具非常出色,但它们确实是为程序员设计的。它们假设你知道 Python 和 Git。它们的界面看起来像 1980 年代的计算机实验室。对于 99% 的非开发人员知识工作者来说,这些强大的 AI 工具并没有针对他们进行优化。

Pomelli、Stitch 和 NotebookLM
在所有 AI 实验室中,Google 似乎正在尝试为其他职业构建最多样化的专用界面。虽然这些界面都略显粗糙,但它们展示了当 AI 工具为其他类型的知识专业人员构建时未来可能的样子。Google 的Stitch 提示了 AI 原生设计可能是什么样子——一个无限画布,你可以用自然语言描述应用程序并获得多个相互连接的屏幕,具有一致的设计系统。同样地,Pomelli 允许你粘贴网站 URL 并自动生成符合品牌的社会媒体活动,采用营销语言而非提示,使其感觉不那么技术化。而最著名的,NotebookLM 提供了一种研究、展示和处理多种信息源的方法。每个界面都展示了未来可能的方向,但目前还远未达到 Claude Code 对于程序员的那种变革性工具。但还有另一种界面经历了爆炸性增长,那就是个人代理。
如果你没有听说过 OpenClaw,它是一个开源的人工智能代理,其标志是一只红色的龙虾,它是一个安全噩梦,并且已经成为历史上增长最快的开源项目之一。OpenClaw 如此成功是因为它是一个真正的个人助手。系统设计得让你可以通过 WhatsApp 或 Telegram 或 Slack 这些你用来与人交流的应用程序与你的 AI 代理交谈。你可以告诉它检查你的电子邮件、预订桌子、查找文件,然后它会在你的电脑上执行这些操作。它通过一种事后看来显而易见的方式解决了界面问题:不是通过聊天机器人或命令行,而是让你以与人交谈的方式与 AI 交互,使用像 WhatsApp 这样已经非常熟悉的界面。

然而,OpenClaw 使用起来很困难,并且存在许多安全风险。Anthropic 的解决方案是结合使用 Claude Cowork 和 Dispatch。Cowork 于今年一月推出,是为知识工作者设计的 Claude Code 版本。它让 Claude 可以通过桌面工作区访问你的本地文件和应用程序。它还通过连接器连接到几十个应用程序,当没有现成的连接器时,它会退回到直接控制你的鼠标和键盘。Dispatch 在最近几周推出,增加了关键的一环:你可以在手机上给正在桌面工作的 Claude 发送消息。你扫描一个二维码,你的手机就变成了一个远程控制器,用于控制坐在你电脑上的 AI 代理。
使用 Dispatch 和 Claude Code 的组合创建了一个感觉像是在与一位称职的助理交谈的界面。例如,我从手机上请求 Claude 准备一份早晨简报,它读取了我的日历、邮件和在线渠道,然后给我提供了一份下一步需要做什么的报告。但 Cowork 还能做更复杂的工作。从我的手机上,我让它查看我最近制作的一个演示文稿,并检查第 3 张幻灯片中的图表是否是最新的,如果不是,则更新它。你可以看到它在一个地方稍微卡住了(某个网站阻止了它下载文件),但除此之外,结果非常令人印象深刻。它打开了并“查看”了 PowerPoint,并在我的整个计算机上查找了更多最新的数据。当我给它一个更更新的在线论文链接时,它下载了 PDF 文件,找到了更新的图表,剪切出图表图像,并替我更新了 PowerPoint。这是复杂且繁琐的工作,即使不总是无缝衔接,但通常足够接近以节省大量时间。

这是否像 OpenClaw 那么灵活?不。Cowork 是沙盒化的,更安全但功能更有限(但这并不意味着没有安全风险)。连接器生态系统正在增长但还不完整。Cowork 能够使用你的计算机的概念虽然令人印象深刻,但在实践中却容易出错。但核心见解与 OpenClaw 所发现的一样。人们不需要聊天机器人。他们想要的是一个可以处理他们实际文件和工具的代理,并且可以像与人交谈一样访问它。
所有这一切都假设我们需要预先决定我们的界面。但最新的 AI 系统实际上可以为你生成界面。例如,在过去的几周里,Claude 获得了直接在对话中生成可视化的能力。这些不是静态图像。它们是可交互的、可调整的,并且当你提出后续问题时,Claude 可以修改它们。

这是一种不同的界面问题解决方法。不是让公司为每种类型的工作构建专门的界面,AI 会根据需要动态生成正确的界面。我怀疑未来不会只有一个统治一切的界面。而是 AI 会根据需要生成正确的界面,一个在桌面上的代理,对话中的图表,或者一个自定义应用来解决问题。我们正从适应 AI 的界面转向 AI 根据需要调整其界面以适应你。
AI 能力的发展一直领先于 AI 的可访问性。这些模型已经足够聪明,可以做一些非凡的事情,但我们一直在通过聊天机器人让人们接触这种智能。正如那项认知负荷研究所示,聊天机器人的格式实际上是在阻碍他们。随着界面的改进,我们将看到当越来越多的人能够实际使用 AI 的能力时会发生什么。每个缩小这一差距的新界面都会让人感觉像是 AI 能力的一次飞跃,即使模型本身没有改变(尽管它们仍在变化)。我猜,人们有时表达的“对 AI 失望”的情绪并不是因为 AI 本身不好,而是因为界面不对。我们构建了近来最强大的技术之一,然后让人们通过输入聊天窗口来访问它。这种情况很快就会改变。
对于基于较旧 AI 模型的研究论文,总是需要谨慎对待,但在这个案例中,我认为从现已过时的 GPT-4o 到 GPT-5.4 或其他版本之间可能没有太大变化,因为它们都显示了大量的文本墙。