T
traeai
登录
返回首页
向阳乔木(@vista8)

https://t.co/o6CEQEW0V4

8.5Score
https://t.co/o6CEQEW0V4

TL;DR · AI 摘要

Every公司的CEO Dan Shipper分享了AI工具在实际工作中的应用,揭示了AI越强反而使人更忙的现象,并预测未来工作方式将向公司级和工作操作系统方向发展。

核心要点

  • AI工具在实际工作中存在缺陷,无法主动发现问题并重新定义。
  • 未来工作方式将向公司级和工作操作系统方向发展。
  • SaaS厂商需要同时对人和Agent友好,以适应新的工作模式。

结构提纲

按章节快速跳转。

  1. Dan Shipper分享了Every公司全员使用AI工具的实际体验和观察。

  2. Dan通过Benchmark测试展示了AI工具在修复代码和解决问题方面的局限性。

  3. Dan指出自动化创造了新的工作,如管理自动化本身。

  4. Dan预测未来工作方式将向公司级和工作操作系统方向发展。

  5. ·SaaS厂商的新挑战

    Dan认为SaaS厂商需要同时对人和Agent友好,以适应新的工作模式。

  6. Dan认为AI的真正前沿在于实际工作场景的应用,而非理论研究。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • AI在实际工作中的应用

金句 / Highlights

值得收藏与分享的关键句。

#AI#Every公司#Dan Shipper#工作方式变革#SaaS
打开原文

Article

Image 1: Image

AI越强,人越忙:一个住在未来的人说了什么

著名PM人Lenny访谈了Every公司的CEO,很多观点犀利且反共识,让AI写一篇总结。

原始视频:

一家 30 人的公司,全员 AI 重度用户,人人用 CodexClaude Code 干活。

按理说,这种公司应该越来越精简才对。

但过去一年,他们的员工人数翻了一倍。

这家公司叫 Every,CEO 叫 Dan Shipper。

他不是在硅谷的实验室里预测未来,他是真的住在未来。

工程师、编辑、销售、客服,所有人都在用最新的AI工具干活,然后 Dan 会把他们实战的经验和观察写出来。

去年他说 Claude Code 被严重低估,没人信,后来 Anthropic 围绕这个方向建了整个产品线。

所以当他说"AI 越强,人反而越忙",值得认真听一听。

Image 2: Image

Dan 说这不是在抱怨,他是在描述一个他亲身经历的悖论。

他自己做了一个Benchmark,叫"高级工程师基准测试"。

起因很狼狈:他把自己的写作工具 Proof 用 vibe coding 做出来,上线第二天服务器每隔 10 分钟就崩一次。

他让 Codex 修,Codex 说修好了,然后又冒出四个新 bug,循环往复,一晚上没睡着。

后来他请了两位真正的高级工程师,分别独立重写了这个代码库。

于是他有了这个"高级工程师基准测试":让 AI 接手同一个烂摊子,从头重写。

结果:几乎所有模型得分在 30 分左右。人类高级工程师能到 85 到 90 分。

GPT-5.5 是唯一的异类,跳到了 62 分。

而且它是唯一一个真的敢推倒重来的模型,其他模型接到"去修这些 bug"的指令,就真的去一个一个修 bug 了。

人类高级工程师会怎么做?

他会先扫一眼代码库,然后说:"这玩意儿是坨屎,我们得重写,我知道你不想听,但就是这样。"

他自己判断出来的。

模型能解决被定义清楚的问题,但"发现这个问题需要被重新定义"这件事,模型还不会主动做。

基准测试的分数在涨,但它永远只能测量人类已经想清楚、能打分的那部分工作。

剩下那部分,没法打分,因为你得先想到要问这个问题。

这就是为什么 Every 的人越招越多。

每一个 Agent 背后,都需要一个真正关心它在做什么的人。

自动化没有消灭工作,它创造了新的工作:管理自动化本身。

Dan 把这叫做"每个 Agent 都需要一个人"。

Image 3: Image

Dan 的预测是:未来一年内,大多数人的工作方式会朝两个方向同时演化。

第一种:公司共用一个超级 Agent。

不是每个人一个私人助理,而是整个公司共用一个 Agent,挂在 Slack 里,所有人都能调用。

Shopify 已经有了,Ramp 也有了。

Dan 最初以为每个人都会有自己的私人 Agent,像《黄金罗盘》里每个人肩上的精灵,是灵魂的一部分。

黄金罗盘一口气解读版

他对这个图景着迷了很久,然后彻底改变了看法。

原因很简单:Agent 需要有人照料它。

OpenClaw 刚出来的时候,Every 所有人都兴冲冲地设置了自己的 Agent,然后一个个放弃了。

因为它会坏,要 SSH 进服务器,要不停地调整,大多数人坚持不了多久。

一旦没人关心它在做什么,它就会悄悄变得没用。

所以现实的路径是:先有一个公司级别的通用 Agent,由专人负责维护,再随着模型变得更可靠,逐渐向下分裂出团队级别、个人级别的 Agent。

这个专门负责维护 Agent 的人,Dan 叫他"前沿部署工程师",Every 内部已经有这样的岗位了。

前沿部署工程师模式(Forward Deployed Engineer,FDE)起源于Palantir,其核心在于通过“驻场工程师+业务专家”的协同模式,将技术能力与业务需求深度融合.

第二种:Codex 或 Claude Code 成为新的工作操作系统。

这是 Dan 更兴奋的部分,也是更难一句话说清楚的部分。

他现在处理邮件的方式是:让 Codex 打开内置浏览器,把所有邮件聚合到一个页面,然后他对着屏幕说话。

"这封律师的问题,去把过去四年的文件整理成报告发过去。"

Codex 就去做了。

他已经连续 10 天保持收件箱清零,这对他来说是从没有过的事。

写文章也一样。

他在 Codex 的内置浏览器里打开 Proof,Codex 能看到他在写什么,他也能看到 Codex 在做什么,两者实时协作。

招人也是,他想找一个在 General Assembly 做过技术教育、现在又对 AI 感兴趣的人,直接跟 Codex 说。

然后他就做别的事了,回来发现 Codex 找到了一个完全符合条件的人,还在 Twitter 上关注了他。

Dan 直接发了私信,约了顿饭。

过去我们把 AI 嵌进 SaaS 工具,未来是把 SaaS 工具放进 AI Agent 里跑。

他在 Codex 里用 Proof,用的是他自己的 token,不是 Proof 这个产品的 token。

SaaS 厂商不需要烧钱堆 AI 功能,用户把 AI 带过来,SaaS 只需要让自己对人和 Agent 都友好就够了。

利润率反而可能回升。

Image 4: Image

Dan 说得很直接:CLI 的时代过去了,我们把它速通了。

Claude Code 火起来的时候,很多人以为是终端命令行的魔力让它好用。

Dan 认为这个判断是错的。

真正的原因是 Agent 在本地机器上有完整的访问权限,以及网上有大量关于如何使用终端的内容,让模型学得很好。这和 CLI 本身没什么关系。

Every 内部,大多数技术人员已经不把终端当主要工作界面了。

偶尔还会切进去,但主战场是 Codex、Claude Code、Cursor 这些有真正界面的工具。

GUI 本来就是为了让人更舒服而发明的,这个逻辑没有变过。

Image 5: Image

Dan 说他现在会买 SaaS 股票。

大家都在说 Agent 会让人绕过 SaaS,直接用 AI 干活。

但 Dan 的观察是反过来的:Agent 不会替代 SaaS 的用户,它会成为 SaaS 新的用户。

Every 内部人人都用 Codex 和 Claude Code,但他们的 SaaS 支出比去年还高。

因为 Agent 在用 SaaS,大量的 Agent,高频次地调用。

需求在爆炸,不是萎缩。

他还提到一个细节:Every 的 Proof 是开源的,用户遇到问题,不是自己发邮件给客服,而是他们的 Agent 直接发一份 bug 报告,里面有精确的复现步骤,有对代码库的分析,直接变成 GitHub issue,然后 Every 的 Agent 去修。

这个闭环,比任何人工客服流程都快。

对 SaaS 公司来说,真正需要做的事情变了:不是把 AI 塞进自己的产品,而是让产品同时对人和 Agent 友好,两者能在同一个界面上协作,各自看到对方在做什么。

Image 6: Image

Dan 对这两个角色极度看好。

Marcus,PM 出身,之前在 Axios 负责写作产品,带大团队做到了几千万 ARR。

后来他休息了一年,专门学会了用 Cursor。

现在他在 Every 负责写作应用 Spiral,是团队里出货最快的人之一。

Dan 说,哪怕一年前,他们也没办法安排 Marcus 做这个工作,因为那时候模型还不够好。

但现在,Marcus 的产品感和用户洞察,配上足够好的编程模型,变成了一种超强组合。

他不需要组织一整个团队来实现自己的想法,他直接去做。

设计师也一样。

以前最大的痛苦是:想到了一个绝妙的交互,工程师不想做,或者做出来不是那个味。

现在他们可以自己发 Pull Request,自己把想法变成现实。

而且,当所有人都在用 vibe coding 批量生产千篇一律的界面时,真正懂审美、懂交互的设计师反而更值钱。

能让东西看起来不像 AI 做的,本身就是一种稀缺能力。

Image 7: Image

Dan 的判断是:大规模失业不会发生。

那些被归因于 AI 的裁员,大多数是过度招聘的修正,AI 只是一个方便的借口。

但这不意味着可以躺平。

他给出的建议只有一条,叫"骑上(驾驭)模型"。

不是因为 FOMO,不是因为害怕,而是因为好奇。

每次有新模型出来,把它用在你真正在乎的事情上。

哪怕上次试过不行,这次再试一次看看。

他自己就是这么做的,GPT-5.5 出来,他把高级工程师基准重新跑了一遍,从 30 分跳到了 62 分。

他还说了一件让人意外的事:AI 的真正前沿不在旧金山,而在每一个把 AI 用在真实工作场景里的人那里。

硅谷的人在造它,但不一定知道怎么用好它。

每次新模型出来,你是世界上最早一批发现它能做什么的人之一。

Every 在布鲁克林,不在硅谷。

但 Dan 觉得他们比大多数硅谷公司都更靠近未来,原因只有一个:他们把所有工具都真的用在真实的工作上。

这是他给出的最后一个建议:别争论 AI 会不会改变世界,去找一件你真正头疼的事,试着用 AI 解决它。

当你第一次感受到"这也行?"的那一刻,你就不需要别人再来说服你了。

AI 可能会生成不准确的信息,请核实重要内容

https://t.co/o6CEQEW0V4 | 向阳乔木(@vista8) | traeai