Jerry Liu(@jerryjliu0)2026年5月29日

We comprehensively benchmarked Opus 4.8 on document understanding tasks, and compared it to Opus 4.7...

7.5Score

We comprehensively benchmarked Opus 4.8 on document understanding tasks, and compared it to Opus 4.7...

TL;DR · AI 摘要

Opus 4.8 在文档理解任务上的表现略有提升，但内容忠实度下降，完整结果可在 ParseBench 查看。

核心要点

Opus 4.8 在表格、语义格式和布局方面表现略优于 Opus 4.7。
Opus 4.8 在图表和内容忠实度方面表现略逊于 Opus 4.7。
ParseBench 提供了 Opus 4.8 的全面基准测试结果。

结构提纲

按章节快速跳转。

§引言
介绍 Opus 4.8 和 Opus 4.7 的对比背景。
·性能提升
Opus 4.8 在表格、语义格式和布局上的改进。
·性能下降
Opus 4.8 在图表和内容忠实度上的退步。
·价格调整
Opus 4.8 每页价格略有上涨。
§结论
完整结果可在 ParseBench 查看。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Opus 4.8 Benchmark

金句 / Highlights

值得收藏与分享的关键句。

Opus 4.8 wasn't explicitly post-trained on visual document understanding.
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
Slight gains: tables, semantic formatting, layout.
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
Slight regressions: charts, content faithfulness.
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Opus#ParseBench#LLM#文档理解

从结果来看，Opus 4.8显然未经过专门的视觉文档理解后训练：它在表格/语义格式/布局方面略有提升，但在内容忠实度等方面表现更差。完整结果已在ParseBench发布：parsebench.ai"

我们在文档理解任务上对Opus 4.8进行了全面基准测试，并与Opus 4.7进行了比较。从结果来看，Opus 4.8显然未经过专门的视觉文档理解后训练：它在表格/语义格式/布局方面略有提升，但在内容忠实度等方面表现更差。完整结果已在ParseBench发布：parsebench.ai

引用

Image 1: 方形头像

LlamaIndex Image 2: 🦙

@llama_index

4小时前

Opus 4.8今日发布。ParseBench测评结果出炉。✅小幅提升：表格、语义格式、布局 ⚠️小幅退步：图表、内容忠实度 💰每页成本略增教LLM像人类一样阅读文档仍有大量优化空间。LlamaParse仍是

Image 6: 图片

凌晨3:07 · 2026年5月29日

4,239 次浏览

We comprehensively benchmarked Opus 4.8 on document understanding tasks, and compared it to Opus 4.7... | Jerry Liu(@jerryjliu0) | traeai