新Claude Opus 4.8:你可能错过的15个要点
Claude Opus 4.8多项能力已达Mythos级别,但‘诚实性’仅为渐进式改进;新增可调思考时长与红acted推理块,反映对模型蒸馏的警惕;Anthropic估值近1万亿美元,算力来自Musk/Google/NVIDIA/Microsoft等。
入选理由:Opus 4.8支持用户自定义思考时长(原仅自适应模式),并引入更多红acted推理块以防止技能蒸馏
概念
别名:CAI
Anthropic提出的AI对齐框架,通过人工撰写的‘宪法’约束模型行为。
已跟踪 4 条高相关材料
最近变化
2026-05-29 · Opus 4.8支持用户自定义思考时长(原仅自适应模式),并引入更多红acted推理块以防止技能蒸馏
为什么值得关注
Constitutional AI 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
New Claude Opus 4.8: 15 Things You May’ve Missed
AI Explained · 8.7 分
Claude Opus 4.8在多项能力上接近Mythos级别,但其“诚实性”提升仅为量化渐进而非质变;模型新增可调思考时长、红acted推理块等机制,反映对模型蒸馏与安全风险的警惕;Anthropic已获近1万亿美元估值,算力来源包括Musk/Google/NVIDIA/Mi...
Using MSM, we can also empirically study which model specs or constitutions yield the best generaliz...
Anthropic(@AnthropicAI) · 7.2 分
Anthropic 提出使用 MSM(Model Specification Mapping)实证研究不同模型规格或宪法设计对对齐训练泛化能力的影响,强调解释底层价值观比单纯设定规则更有效。
Widening the conversation on frontier AI
Anthropic News · 5.5 分
Anthropic 启动与宗教、哲学等传统智慧群体的对话项目,探索 AI 道德品格形成机制,已实验验证"伦理提醒工具"可降低模型错位行为发生率,但文章以公关叙事为主,技术细节披露有限。
已收录 4 条与 Constitutional AI 相关的内容,按评分排序。
Claude Opus 4.8多项能力已达Mythos级别,但‘诚实性’仅为渐进式改进;新增可调思考时长与红acted推理块,反映对模型蒸馏的警惕;Anthropic估值近1万亿美元,算力来自Musk/Google/NVIDIA/Microsoft等。
入选理由:Opus 4.8支持用户自定义思考时长(原仅自适应模式),并引入更多红acted推理块以防止技能蒸馏
Anthropic 提出使用 MSM(Model Specification Mapping)实证研究不同模型规格或宪法设计对对齐训练泛化能力的影响,强调解释底层价值观比单纯设定规则更有效。
入选理由:MSM 是一种用于实证评估模型规格与对齐泛化关系的方法论工具。
Anthropic 启动与宗教、哲学等传统智慧群体的对话项目,探索 AI 道德品格形成机制,已实验验证"伦理提醒工具"可降低模型错位行为发生率,但文章以公关叙事为主,技术细节披露有限。
入选理由:Anthropic 与 15+ 宗教及跨文化群体开展对话,研究 AI 道德品格形成
Anthropic 发布研究指出,结合宪法文档与对齐 AI 虚构故事可将代理错位风险降低三倍,且在不同评估场景下依然有效。
入选理由:宪法文档配合虚构故事可显著减少代理错位问题。