Opus 4.8(已全面测试):它真的优秀吗?
AICodeKing3777 字 (约 16 分钟)
87
Claude Opus 4.8在作者自建基准测试中得分87.14%(61/70),显著优于前代;新增Fast模式(2.5倍速、价格降为此前1/3)、高努力默认策略与X-High/max选项,并支持动态工作流与API内系统消息更新,编码诚实性提升4倍。
入选理由:Opus 4.8在70题自测基准中得61分(87.14%),高于GPT-4.5、Gemini 3.5 Flash等主流模型。
精选视频#Claude#大语言模型#Anthropic#AI编码#Benchmark英文
