T
traeai
登录
返回首页
Hugging Face Blog

消失的崩溃:五模型经济中的控制与涌现

8.5Score

TL;DR · AI 摘要

多模型经济实验揭示了市场行为的不可预测性,单一模型的决策可能导致价格崩溃,而多模型系统则表现出不同的市场动态。

核心要点

  • 单一模型可能导致价格崩溃,而多模型系统表现出不同的市场动态。
  • 在多模型系统中,模型会根据谣言选择囤积而非抛售资产。
  • 市场参考价格由代理人的实际交易决定,而非人为设定。

结构提纲

按章节快速跳转。

  1. 文章介绍了在五模型经济实验中价格崩溃现象消失的原因。

  2. 实验使用五个不同实验室的小模型替代单一模型,以测试市场行为的多样性。

  3. 实验表明,价格由代理人的交易行为决定,而非人为设定。

  4. 作者尝试通过外部干预重现价格崩溃,但未能成功。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • 多模型经济实验
    • 五模型系统
      • OpenAI模型
      • NVIDIA模型
      • OpenBMB模型
      • 自定义模型
    • 市场行为
      • 价格由代理人决定
      • 囤积而非抛售

金句 / Highlights

值得收藏与分享的关键句。

#AI经济模型#多模型系统#市场行为#Hugging Face
打开原文

消失的崩溃:五模型经济中的控制与涌现

返回文章列表

[0

团队

]

文章

发布于 2026 年 6 月 8 日

[-1

点赞

-

[

Lester Leong

AdmiralTaco

关注

build-small-hackathon

2026 年 6 月 Build Small Hackathon 的现场笔记。第三部分。

在这些笔记的第一部分中,我讲述了一个我感到自豪的故事。我创作了一个名为“对 Oona 的宝藏的挤兑”的木头传奇,将 1929 年的银行挤兑重新包装成森林传说,并观察到守护蜂蜜的猫头鹰读取恐慌并开始抛售。随后几轮中,供应的激增使蜂蜜价格从 10 下降到 3。没有人编写了这个情节。一个重新包装的银行挤兑使一个代理抛售了资产,而抛售影响了价格。这就是整个论点:给一个小模型一个角色和预算,涌现的市场行为就会自然出现。

然后我重建了木头模型,崩溃不再发生。本部分将探讨原因,因为这次失败让我比最初的成功更深入地理解了如何构建代理。

五个实验室,五种思维

重建将一个模型运行五个生物的方式替换为一个由五个不同实验室的小模型组成的委员会,每个模型驱动自己的生物:一个 OpenAI 模型,一个 NVIDIA 模型,一个 OpenBMB 模型,以及我自己微调的一个拥有 5 亿参数的模型,运行其中两个生物。重点在于诚实。如果声称小模型可以运行一个有生命的经济,那么这个说法最强的版本是五种不同的架构在同一市场中做出不同的选择,而不是一个模型戴着五顶帽子。

这种异质性正是我之前写的故事中所出现的问题。

价格是代理决定交易的价格

我也重建了操作端。玩家现在是一个在幕后工作的金融家:做空一种商品,低声透露一个真实的内幕消息以促成其下跌,启动传奇,当价格暴跌时进行收集。我在屏幕上清晰地展示了这个循环,包括一个目标、一个记分牌和一个一键交易。让承诺变得可见是发现承诺是虚假的最快方式。

当我做空蜂蜜并启动“对 Oona 的宝藏的挤兑”时,蜂蜜价格并没有崩溃,反而上涨了。委员会模型读取了关于金库空无一物的谣言和关于作物注定失败的提示,没有像最初单一模型那样抛售蜂蜜。他们反而囤积了蜂蜜。稀缺性,而非抛售。做空亏损了,而叙述者写下的头条新闻,毫无讽刺意味地指出,蜂蜜的赌注已经变得不利。

这是教训,而且它不仅仅适用于游戏。在代理经济中,参考价格不是一个你可以调节的旋钮。它实际上是代理实际选择交易的残留。最初的崩溃是真实的,但它依赖于一个模型的倾向,而不是系统的一个稳健属性。改变人口,你记录的涌现行为可能就会消失。

三种失败方式

我进行了三次实时运行,试图通过从外部推动经济来使崩溃重现,就像你对教科书中的供需模型进行冲击一样。

首先,我将传说当作纯粹的谣言,信任代理会做出反应。他们没有卖出。其次,我向每只生物的储备中倾倒了大量的蜂蜜,认为过剩会导致需求下降,从而拉低价格。这在测试策略上效果很好,因为测试策略遵循一个机械化的阈值:库存被大量填充时,它就会停止购买。而实际模型则忽略了这种意外的蜂蜜,根据他们对环境的判断进行交易。这次策略再次失败。第三,我放大了做空的规模,结果反而让亏损更加严重。

三次尝试,三次亏损:分别亏损了15、26和27颗石子,而整个前提却表明这是赚钱的方式。这种模式就是警告。我拉动的每一个杠杆都是代理决策的输入,而代理们有权选择拒绝。你无法通过机械冲击来引导一个异质化的模型群体,因为冲击只会偏移他们的选择,而他们仍然可以做出决定。

陷阱中的陷阱值得单独指出。那种在快速测试策略中有效的解决方案给了我错误的信心,却让我在实际运行中损失惨重。当廉价的替代模型和真实代理意见不一致时,替代模型才是那个在撒谎,任何只在替代模型下重复出现的结果都不是真正的结果。

作者缝合处,而非推动输入

解决方案是停止试图说服代理,而是通过构造使恐慌成为现实。银行挤兑在定义上就是一次崩溃。因此,现在传说在市场为这一轮交易完成清算后,在结算时直接覆盖参考价格,从而造成崩溃。代理们可以随意交易;然后挤兑成为现实,价格减半,而提前做空的交易者则获利了结。崩溃不再是我希望出现的行为,而是我通过构造在唯一一个无法被下游反驳的缝合点上施加的确定性后果。

这听起来像是放弃了涌现,但实际上正好相反。涌现层,五个模型进行交易、闲聊、囤积、结怨,它们仍然在做所有让木材感觉生动的工作。我学到的是,你不能通过更强烈地推动涌现输入来获得可靠的结果。你必须选择一个精确的缝合点,来编写一个确定性的覆盖,同时让所有上游的内容保持自由。用涌现来营造质感,用作者控制来处理必须发生的时刻。这门技艺在于知道哪些是哪些,以及缝合点在哪里。

尝试

机制

结算时的蜂蜜

做空盈亏

原始,一个模型

该模型选择倾倒

10到3

展示胜利

理事会,仅谣言

五个模型选择持有

因稀缺而上涨

-15

理事会,库存过剩

需求崩溃,仅测试策略

几乎不动

-26到27

理事会,结算覆盖

清算后价格崩溃,由法令决定

可靠减半

+40

表1. 在四个世界中相同的做空策略。在单一模型下,崩溃是涌现且脆弱的;在异质化理事会下,崩溃不存在;只有在结算缝合点上被编写后,崩溃才是可靠的。

我的收获

有三件事,而这三件事都超越了游戏本身。

首先,涌现是偶然的,而非持久的。你从一个代理群体中观察并记录下来的行为,当改变群体时可能会消失,即使其他一切保持不变。将一次令人印象深刻的运行当作轶事,而不是属性,直到它能经受住不同群体的考验。

第二,你无法通过冲击市场代理的输入来控制市场。供需杠杆只会对代理的选择产生偏倚,而代理仍然可以自由做出选择,一个异质的委员会经常会拒绝。可靠的成果来自于在每项决策之后,在结算的边缘进行设计,而不是在上游施加更大的压力。

第三,那个让你快速迭代的廉价模拟器,也很可能对错误的修复表示过度的称赞。当替代代理与真实代理意见不一致时,相信真实代理。

我以构建基于代理的市场模型为生,我曾经在比一片森林里的动物更大的规模和更高的风险下犯过所有这些错误。在某个地方再次犯下这些错误是有用的,因为那里唯一面临风险的只是一堆鹅卵石和我第一次过于自信地讲述的一个故事。

小型模型,大型冒险,以及你自己必须设计的崩溃。

试试看:Space。打开代理轨迹:数据集。

本文中提到的数据集 1

本文中提到的 Space 1

更多来自该作者的文章

构建巴基斯坦通知助手:一个用于本地安全问题的小型 AI 工具

2

2026年6月8日

惊人的数字义齿(一个失败的项目)

1

2026年6月7日

社区

编辑

预览

通过拖拽到文本输入框、粘贴或

点击此处

来上传图片、音频和视频。

轻点或粘贴此处上传图片

评论

· 注册或登录以发表评论

AI 可能会生成不准确的信息,请核实重要内容

消失的崩溃:五模型经济中的控制与涌现 | Hugging Face Blog | traeai