T
traeai
登录

概念

Constitutional AI

别名:CAI

Anthropic提出的AI对齐框架,通过人工撰写的‘宪法’约束模型行为。

已跟踪 4 条高相关材料

TraeAI 观察

相关材料

已收录 4 条与 Constitutional AI 相关的内容,按评分排序。

New Claude Opus 4.8: 15 Things You May’ve Missed

新Claude Opus 4.8:你可能错过的15个要点

AI Explained5477 字 (约 22 分钟)
87

Claude Opus 4.8多项能力已达Mythos级别,但‘诚实性’仅为渐进式改进;新增可调思考时长与红acted推理块,反映对模型蒸馏的警惕;Anthropic估值近1万亿美元,算力来自Musk/Google/NVIDIA/Microsoft等。

入选理由:Opus 4.8支持用户自定义思考时长(原仅自适应模式),并引入更多红acted推理块以防止技能蒸馏

精选视频#Claude#Anthropic#大语言模型#AI安全#模型蒸馏英文
Using MSM, we can also empirically study which model specs or constitutions yield the best generaliz...

Anthropic 提出使用 MSM(Model Specification Mapping)实证研究不同模型规格或宪法设计对对齐训练泛化能力的影响,强调解释底层价值观比单纯设定规则更有效。

入选理由:MSM 是一种用于实证评估模型规格与对齐泛化关系的方法论工具。

精选推文#AI Alignment#Constitutional AI#MSM#Anthropic#LLM Safety中文
Widening the conversation on frontier AI

拓展前沿 AI 的对话边界

Anthropic News995 字 (约 4 分钟)
55

Anthropic 启动与宗教、哲学等传统智慧群体的对话项目,探索 AI 道德品格形成机制,已实验验证"伦理提醒工具"可降低模型错位行为发生率,但文章以公关叙事为主,技术细节披露有限。

入选理由:Anthropic 与 15+ 宗教及跨文化群体开展对话,研究 AI 道德品格形成

精选文章#AI Safety#Anthropic#Constitutional AI#Alignment#AI Ethics英文
High-quality documents based on Claude’s constitution, combined with fictional stories that portray ...

Anthropic 研究:宪法文档与虚构故事降低 AI 错位风险

Anthropic(@AnthropicAI)85 字 (约 1 分钟)
55

Anthropic 发布研究指出,结合宪法文档与对齐 AI 虚构故事可将代理错位风险降低三倍,且在不同评估场景下依然有效。

入选理由:宪法文档配合虚构故事可显著减少代理错位问题。

精选推文#AI 安全#大模型对齐#Anthropic#智能体 AI#宪法 AI中文

跨材料问答 · Constitutional AI

回答基于:Constitutional AI 相关 4 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容