Alex Albert(@alexalbert__)
We put a lot of work into calibrating thinking effort for Opus 4.8. As you're trying out the model...
5.5Score

TL;DR · AI 摘要
Opus 4.8 的思考校准工作已取得进展,但仍需用户反馈以改进模型的思考力度。
核心要点
- Opus 4.8 的开发团队投入大量精力校准模型的思考力度。
- 用户在测试模型时,应报告模型思考过度或不足的案例。
- 开发团队希望通过用户反馈进一步优化模型性能。
结构提纲
按章节快速跳转。
开发团队详细介绍了为 Opus 4.8 校准思考力度的工作。
用户反馈是改进模型思考力度的关键。
开发团队计划根据反馈进一步优化模型性能。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- 开发团队工作
金句 / Highlights
值得收藏与分享的关键句。
We put a lot of work into calibrating thinking effort for Opus 4.8.
As you're trying out the model, if you do run into any examples of it still over/under thinking, please flag it to us!
hello beloved tasteful users, do you like how much claude thinks on your tasks?
#Opus#AI模型#模型校准
打开原文Alex Albert 在 X 上表示:“我们在 Opus 4.8 的思考力度校准上投入了大量工作。当你尝试该模型时,如果发现它仍然存在过度或不足思考的情况,请务必向我们反馈!” / X
别错过正在发生的事情

Alex Albert 
我们在 Opus 4.8 的思考力度校准上投入了大量工作。当你尝试该模型时,如果发现它仍然存在过度或不足思考的情况,请务必向我们反馈!
引用

kipply
@kipperrii
·
6h
亲爱的品味独到的用户们,你们觉得 Claude 在任务上的思考程度如何?非常希望收到关于它思考过多或过少的具体例子
·
30
7
344
20
阅读全部30条回复