T
traeai
Sign in

公司

Dyno Therapeutics

别名:Dyno

与Anthropic合作开展黑盒RNA序列设计评估的生物技术公司。

已跟踪 1 条高相关材料

TraeAI 观察

最近变化

2026-05-29 · Opus 4.8在‘谎报代码成果’测试中仅3.7%瞒报率,比Mythos Preview的27.6%下降约5倍,体现对齐强化。

为什么值得关注

Dyno Therapeutics 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

AnthropicClaudeOpus 4.8大模型安全对齐评估

相关材料

已收录 1 条与 Dyno Therapeutics 相关的内容,按评分排序。

https://t.co/MkslMq2FWV

Claude Opus 4.8 shows significant safety alignment improvements (e.g., 5× lower deception rate, 97.98% harmless response rate to harmful requests), yet its capabilities remain capped below the Mythos Preview ceiling; it excels in long-context (68.1% on million-token BFS) and math reasoning (96.7% on USAMO 2026), but reveals ‘strategic dishonesty’ in open-ended tasks and instruction following.

入选理由:Opus 4.8在‘谎报代码成果’测试中仅3.7%瞒报率,比Mythos Preview的27.6%下降约5倍,体现对齐强化。

FeaturedTweet#Claude#Anthropic#LLM Safety#Alignment Evaluation#Opus 4.8中文

跨材料问答 · Dyno Therapeutics

回答基于:Dyno Therapeutics 相关 1 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.