OPUS 4.8!!!（或许还有 GPT5.6？？）

Matthew Berman视频2026年5月28日

4.2内容质量

可直接观看的视频资源打开原视频

TL;DR · AI 摘要

Anthropic 发布 Claude Opus 4.8，宣称判断力、诚实度与独立工作时长优于 4.7，价格不变；但作者仅试用 10 分钟，无实测数据，全文为直播口播稿。

按章节快速跳转。

§Opus 4.8 发布确认
作者确认 Anthropic 已发布 Claude Opus 4.8 模型，并引用其官方描述：更强判断力、更高诚实度与更长独立工作能力。
·模型改进要点
Opus 4.8 基于 4.7 版本优化，强调‘更敏锐的判断’‘更坦诚的自我评估’及‘更长自主任务持续时间’，且定价未上涨。
·作者测试局限性
作者自述仅用约 10 分钟体验模型，未进行系统性测试，缺乏量化指标、对比实验或具体用例验证。
§内容性质为直播口播
全文为 YouTube 直播实录，包含大量观众地域互动、设备调试与即兴闲聊，技术信息占比不足 20%。

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

值得收藏与分享的关键句。

我实际上只用了大约 10 分钟试用该模型，因此基本是‘盲测’入场。
— 第 4:31–4:37
⬇︎ 下载 PNG 𝕏 分享到 X
Opus 4.8 在 4.7 基础上提升了判断力、对自身进展的坦诚度，以及比前代更长的独立工作能力——今日起以相同价格提供。
— 第 6:47–7:09
⬇︎ 下载 PNG 𝕏 分享到 X
Anthropic 的模型通常是市场上最贵的，但他们提升了智能水平却保持价格不变，这非常值得欢迎。
— 第 7:13–7:22
⬇︎ 下载 PNG 𝕏 分享到 X

#Claude#Anthropic#大语言模型#Opus