Apodex ：一个面向深度研究而打造的 Self-evolving heavy-duty solver

专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题

可一次最多派出 150 个子 ...

小互(@imxiaohu)

小互(@imxiaohu)2026年6月18日

Apodex ：一个面向深度研究而打造的 Self-evolving heavy-duty solver 专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题可一次最多派出 150 个子 ...

8.5Score

TL;DR · AI 摘要

Apodex 是一个专为解决复杂研究问题设计的 Self-evolving solver，支持多 Agent 协作、自我验证和任务调度。

核心要点

Apodex 可同时调度 150 个子 Agent，执行超过 15,000 步。
Apodex 在 BrowseComp 上超越 GPT-5.5-pro，在 DeepSearchQA 上超越 Claude-Opus-4.8 和 Kimi-K2.6。
Apodex 内置三层自我验证机制，包括冲突审查、事实检查和草稿审查。

结构提纲

按章节快速跳转。

§引言
Apodex 是一个专为解决复杂研究问题设计的 Self-evolving solver。
·核心机制
Apodex 支持多 Agent 协作，主 Agent 拆解任务并派发给子 Agent。
›自我验证机制
Apodex 内置三层自我验证机制，确保结果的准确性和可靠性。
·AgentOS 驱动
Apodex 由 AgentOS 驱动，负责调度、路由、事件流等底层事务。
›AgentOS 的功能
AgentOS 提供调度、路由、事件流、检查点、成本记账和权限管理等功能。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Apodex
- 核心机制
  - 多 Agent 协作
  - 自我验证机制
  - AgentOS 驱动
- 性能表现
  - 支持 150 个子 Agent 并行
  - 执行超过 15,000 步
  - 在多个基准测试中超越主流模型

金句 / Highlights

值得收藏与分享的关键句。

Apodex 可一次最多派出 150 个子 Agent 并行探索，总共能跑 15,000 步。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
Apodex 在 BrowseComp 上超越了 GPT-5.5-pro，在 DeepSearchQA 上超越了 Claude-Opus-4.8 和 Kimi-K2.6。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
验证器在结构上是独立于推理器的，被提示去'评估'而不是'继续推理'，可以推翻前面的结论。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Apodex#AI#多 Agent#Self-evolving#研究工具

打开原文

小互 on X: "Apodex ：一个面向深度研究而打造的 Self-evolving heavy-duty solver 专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题可一次最多派出 150 个子 Agent 并行探索，总共能跑 15,000 步在 BrowseComp 上超越了 GPT-5.5-pro，在 DeepSearchQA 上超越了 Claude-Opus-4.8 和 Kimi-K2.6... https://t.co/s46gS7Abfo" / X

小互

@xiaohu

Apodex ：一个面向深度研究而打造的 Self-evolving heavy-duty solver 专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题可一次最多派出 150 个子 Agent 并行探索，总共能跑 15,000 步在 BrowseComp 上超越了 GPT-5.5-pro，在 DeepSearchQA 上超越了 Claude-Opus-4.8 和 Kimi-K2.6... 在科研和金融领域具有强大的研究能力 ... 它的工作步骤是：深度研究—自我校验—撰写主要特点： 1、多 Agent 团队协作：主 Agent 接到任务后拆解成子问题，异步派发给专业化的子 Agent，每个子 Agent 有自己独立的上下文、提示词和工具集。子 Agent 的报告汇入共享报告池，编排器异步读取，不会被最慢的那个卡住。单任务最高可调度 150 个子 Agent，执行超过 15,000 步。 2、内置三层自我验证机制：当子 Agent 报告出现分歧时，冲突审查员介入；具体声明需要落地时，事实检查员介入；草稿完成时，草稿审查员过一遍。最后还有一个全局验证器对所有汇集的证据做终审。验证器在结构上是独立于推理器的，被提示去"评估"而不是"继续推理"，可以推翻前面的结论。 3、由一个专门的 AgentOS 驱动：与执行任务严格分离，它只负责通用的底层事务： - Agent调度 — 150 个子 Agent 谁先跑谁后跑，资源怎么分配。 - 模型和工具路由 — 这个子任务该调哪个模型、该用哪个工具（搜索引擎、代码执行器、数据库等）。 - 事件流 — 子 Agent 之间怎么传递消息和状态更新。 - 检查点和追踪 — 跑到哪一步了，出错了能不能回滚。 - 成本记账 — 这个任务总共调了多少次 API，花了多少钱。 - 权限管理 — 哪些工具允许用，哪些数据允许访问。这种设计好处是：当你添加新应用时候，只需一个插件代码文件夹，底下的调度、路由、记账、追踪这些基础设施全都现成的，不用动内核一行代码。

00:00

5:58 AM · Jun 18, 2026

10.3K

Views

3

1

31

6

33

5

8

58

Read 31 replies

Apodex ：一个面向深度研究而打造的 Self-evolving heavy-duty solver 专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题 可一次最多派出 150 个子 ...