T
traeai
登录
返回首页
One Useful Thing

管理作为AI超级能力

8.5Score
管理作为AI超级能力

TL;DR · AI 摘要

AI正在重塑创业流程,但真正的超级能力是管理:根据三项指标判断何时将任务交给AI。

核心要点

  • 学生用AI工具在4天内完成传统需一学期的创业项目,效率提升一个数量级。
  • 决策是否委托AI给任务的关键是三个变量:人类基准时间、成功率概率和AI处理时间。
  • 管理能力成为新核心竞争力,因为AI降低了试错成本,让快速迭代与多方向探索成为可能。

结构提纲

按章节快速跳转。

  1. 作者在宾大MBA课堂中让学生用AI工具四天内打造原型,成果远超以往一学期水平。

  2. ChatGPTClaudeGemini被用于创意生成、市场调研、财务建模等环节,显著缩短开发周期。

  3. 多数原型具备核心功能而非仅界面展示,且想法更丰富多样,分析更具洞察力。

  4. 因AI便宜且快,团队可轻松尝试多个方向甚至同时探索多个初创点子,无需担心前期投入浪费。

  5. 真正优势不是技术本身,而是判断何时将任务交给AI的能力,取决于三项量化指标。

  6. 应基于人类基准时间、AI成功率概率和AI过程时间来决定是否使用AI,避免无效重复劳动。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Management as AI Superpower
    • AI Accelerates Startup Creation
      • Prototype Development in Days vs Weeks
      • Enhanced Idea Diversity & Market Insight
    • Reduced Cost of Pivoting
      • Low Barrier to Try Multiple Directions
      • No Lock-in from Early Investment
    • Delegation Decision Framework
      • Human Baseline Time
      • Probability of Success
      • AI Process Time

金句 / Highlights

值得收藏与分享的关键句。

#AI#管理#创业#生产力
打开原文

我刚刚在宾夕法尼亚大学教授了一门实验课程,挑战学生在四天内从零开始创建一家初创公司。班上的大多数人都是在读工商管理硕士,因此他们一边上课一边在各种大中型公司的医生、管理者或领导岗位上工作。很少有人有过编程经验。我向他们介绍了 Claude CodeGoogle Antigravity,他们需要使用这些工具来构建一个可运行的原型。但仅仅有一个原型并不意味着一家初创公司,所以他们还使用了 ChatGPT、Claude 和 Gemini 来加速想法生成、市场研究、竞争定位、演示和财务建模的过程。我对他们在如此短的时间内能走多远感到好奇。结果证明他们走得非常远。

我从事创业教育已经有十多年了,见过成千上万的创业点子(其中一些已经发展成为大型公司),所以我对一群聪明的工商管理硕士生能完成多少事情有很好的了解。我认为,在短短几天内看到的东西比没有 AI 的情况下学生在一个完整学期里完成的工作还要先进一个数量级。大多数原型不仅仅是示例屏幕,实际上核心功能已经可以运作。想法比平时更加多样和有趣。市场和客户分析也很有见地。这真的令人印象深刻。这些还不是正在运营的初创公司,也不是完全投入使用的成品(有几个例外除外)——但它们已经从传统过程中节省了几个月的时间和大量的金钱与努力。此外,还有另一点:大多数早期初创公司都需要转型,在学习市场想要什么和技术上可行性的过程中改变方向。通过降低转型成本,探索可能性变得更加容易,而不会被锁定,甚至可以同时探索多个初创公司:你只需要告诉 AI 你想要什么。

我希望我能说这种令人印象深刻的结果是由于我的出色教学,但实际上我们还没有一个很好的框架来如何使用所有这些工具,学生们主要是靠自己摸索出来的。幸运的是,他们有一些管理和专业知识,因为事实证明成功的关键其实是上一段的最后一部分:告诉 AI 你想要什么。随着 AI 在能够花费人类数小时才能完成的任务上变得越来越有能力,并且评估这些结果变得越来越耗时,擅长委派的价值在增加。但是,什么时候应该将任务委托给 AI?

其实我们已经有了答案,但这个答案有点复杂。考虑三个因素:首先,由于 AI 能力的锯齿状前沿,你无法可靠地知道 AI 在复杂任务上表现得好还是不好。其次,无论 AI 表现得好还是不好,它肯定是快速的。它可以在几分钟内完成人类需要花很多小时才能完成的工作。第三,它是廉价的(相对于专业工资),而且如果你生成多个版本并丢弃大部分版本,它也不会介意。

这三个因素意味着决定是否将任务委托给 AI 取决于三个变量:

  1. 人类基准时间:你自己完成这项任务需要多长时间
  2. 成功率概率:AI 在一次尝试中产生符合你标准的输出的可能性
  3. AI 处理时间:请求、等待和评估 AI 输出所需的时间
图像 1

一个有用的思维模型是你在“完成整个任务”(人类基准时间)和“支付开销成本”(AI 处理时间)之间进行权衡,可能需要多次尝试直到得到可接受的结果。成功率概率越高,你需要支付的 AI 处理时间 就越少,将事情交给 AI 就越有用。例如,考虑一项需要你花一个小时完成的任务,但 AI 可以在几分钟内完成,尽管检查答案需要三十分钟。在这种情况下,只有当 成功率概率 非常高时,你才应该将工作交给 AI,否则你会花费更多时间生成和检查草稿,还不如自己做。然而,如果 人类基准时间 是十个小时,那么假设 AI 能胜任工作,花几个小时与 AI 合作可能是值得的。

图像 2

一个需要人类花费许多小时的提示,初始的 AI 处理时间为 30 分钟(你可以做其他事情),加上编写提示的时间。然而,如果需要进行大量修正,那就得不偿失了。

我们知道这个方程是有效的,因为去年夏天,OpenAI 发布了一篇关于人工智能和实际工作的非常重要的论文,GDPval。我之前已经讨论过它,但关键在于它让来自金融、医学到政府等不同领域的经验丰富的人类专家与最新的 AI 进行对抗,而另一组专家则担任裁判。专家们平均需要七小时来完成这项工作,因此在这种情况下,这就是人类基准时间AI处理时间很有趣:AI 只需几分钟就能完成任务,但它需要一个小时让专家检查工作,当然,编写提示也需要时间。至于成功概率,当 GDPval 刚发布时,裁判多数时候给人工工作的结果打分更高,但在 GPT-5.2 发布后,平衡发生了变化。GPT-5.2 思维和 Pro 模型平均有 72% 的时间与或击败了人类专家。

图像 3

在“草稿→审查→如有必要重试”的工作流程中,AI 辅助工作带来的速度和成本改进(相对于未辅助的专家)。GPT-5.2 点是基于其在 GDPval 上约 72% 的胜率或平局率的预测;其他模型点来自 GDPval 论文。现实世界中的结果会因任务而异:有些任务是“轻松胜利”,有些则是明显的失败,最难的任务可能是看似合理的失败。

我们现在可以计算一下,在一个需要七小时的任务中,假设成功的概率为 72%,并且需要一个小时的评估,你能节省多少时间。如果你尝试每项任务时都花时间向 AI 提示,评估答案一小时,然后如果 AI 的回答不好再自己做,你平均能节省三小时。AI 失败的任务会花费更长时间(因为你浪费了提示和评估的时间!),而 AI 成功的任务会快得多。但我们还可以通过管理技巧进一步优化这个方程!

我们可以通过三种方式提高向 AI 分配任务的价值,即增加成功概率并降低 AI 处理时间。我们可以提供更好的指令,设定明确的目标,使 AI 更有可能成功执行。我们可以更好地进行评估和反馈,这样我们就需要更少的尝试来让 AI 做正确的事情。我们还可以更容易地评估 AI 是否擅长某项任务而不必花费太多时间。所有这些因素都会因主题专业知识而得到改善——专家知道该给出什么指令,他们能更好地看到问题所在,并且更擅长纠正问题。

图像 4

如果你不需要特定的东西,AI 模型已经变得非常有能力自行解决问题。例如,我发现 Claude Code 在一个提示下生成了一个完整的 1980 年代风格的冒险游戏:“创建一个完全原创的旧式 Sierra 风格的冒险游戏,使用类似 EGA 的图形。你应该使用你的图像代理生成图像并给我一个解析器。让所有的谜题有趣且可解。完成游戏(应该需要 10-15 分钟来玩),不要问任何问题。让它令人惊叹和愉快。”仅此而已,AI 完成了所有事情,包括艺术创作。通过两个最终提示,它测试了游戏并部署了它。你可以亲自玩这个游戏:enchanted-lighthouse-game.netlify.app

图像 5

这确实令人惊叹,但这种惊叹感是因为我不需要特定的东西,只是想要一个 AI 自由发挥的冒险游戏。但真实的工作和真正的委托意味着你有一个特定的输出目标,而这正是事情变得棘手的地方。你如何向 AI 传达你的意图,以便它能够执行你想要的内容,同时还能使用“判断力”解决问题,但仍给你所需的输出?

这个问题在人工智能之前就存在已久,并且如此普遍,以至于每个领域都发明了自己的文书工作来解决它。软件开发者编写了产品需求文档。电影导演会移交镜头清单。建筑师创建设计意图文件。海军陆战队使用五段命令(情况、任务、执行、行政、指挥)。顾问通过详细的可交付成果规范来界定项目范围。所有这些文档在指导这种新的自主性工作中都非常有效(而且AI可以处理多页的指令)。你可以使用许多格式来指导AI的原因在于,所有这些都是同一件事的不同表现形式:试图将一个人头脑中的东西转移到另一个人的行动中。

当你查看良好的委托文档的内容时,你会发现它们惊人地一致:我们要完成什么,为什么?委托权限的限制在哪里?“完成”是什么样子?我需要哪些具体的输出?我需要哪些中间输出来跟踪你的进度?在告诉我你完成了之前,你应该检查什么?如果这些规定得当,无论是人类还是AI,都更有可能做好工作。

而在弄清楚如何向AI提供这些指令的过程中,结果发现你基本上是在重新发明管理。

作为一名商学院教授,我发现一些主要AI实验室中最知名的软件开发者注意到他们的工作从编程为主转变为主要管理AI代理。编程一直有着非常有组织的结构,具有明确可验证的输出(代码要么有效,要么无效),因此它是AI工具最早成熟的应用领域之一,也是第一个感受到这种变化的职业。但这不是最后一个。

图像 6

作为一个商学院教授,我认为许多人已经具备了与AI代理合作所需的技能,或者可以学习这些技能——这些是管理101的基本技能。如果你能解释你需要什么,给出有效的反馈,并设计评估工作的方法,你就能与代理合作。在很多方面,至少在你的专业领域内,这比尝试设计聪明的提示来帮助你完成工作更容易,因为它更像是与人合作。同时,管理一直假设稀缺性:你委派任务是因为你自己不能做所有事情,并且因为人才有限且昂贵。AI改变了这个方程。现在,“人才”是丰富且廉价的。稀缺的是知道该要求什么。

这就是为什么我的学生表现得如此出色。他们并不是AI专家。但他们花了多年时间学习如何在其专业领域内界定问题、定义可交付成果,并识别财务模型或医疗报告是否偏离正轨。他们从课堂和工作中获得了宝贵的框架,这些框架成为了他们的提示。那些经常被视为“软”的技能实际上是最难掌握的。

我不知道当每个人都是管理者并拥有一个不知疲倦的代理团队时,工作会是什么样子。但我怀疑那些能够茁壮成长的人将是那些知道什么是好的——并且能够清晰地解释到连AI都能实现的人。我的学生在四天内就明白了这一点。不是因为他们是AI原住民,而是因为他们已经知道如何管理。所有的培训,结果证明,都在无意中为他们准备了这一刻。

AI 可能会生成不准确的信息,请核实重要内容