T
traeai
登录

人物

Jan Leike

别名:janleike

AI 安全研究员,曾任 DeepMind 研究员,现关注 LLM 可解释性与对齐。

已跟踪 4 条高相关材料

TraeAI 观察

相关材料

已收录 4 条与 Jan Leike 相关的内容,按评分排序。

When I started to work on the alignment problem more than 10 years ago, we had no idea how AGI was g...

Jan Leike 在 X 上谈 AI 对齐研究的十年演进

Jan Leike(@janleike)292 字 (约 2 分钟)
75

Jan Leike 回顾了超过十年来 AI 对齐(alignment)研究的演变:从最初仅十几人参与、方法模糊的边缘领域,发展到如今因 RLHF 和可扩展监督等技术进步而变得实用,并推动了像 Claude 这样的模型具备宪法机制和自动化对齐研究。

入选理由:10 年前 AI 对齐领域仅有约 12 人作为副业从事研究,且方法混乱。

精选推文#AI 对齐#AGI#RLHF#机器学习英文
Jan Leike(@janleike) 图标

Jan Leike 在 X 上:感谢多年在对齐领域合作的天才们

Jan Leike(@janleike)120 字 (约 1 分钟)
45

Jan Leike 感谢多年在 AI 对齐领域合作的顶尖人才,称与动机强烈的人共事是一种特权。

入选理由:Jan Leike 感谢了多年在 AI 对齐领域合作的顶尖人才

精选推文#AI 对齐#OpenAI#伦理英文

跨材料问答 · Jan Leike

回答基于:Jan Leike 相关 4 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容