T
traeai
登录
返回首页
量子位

DeepSeek阮翀加盟元戎首秀,详解基座VLA,研发提效10倍

9.0Score
DeepSeek阮翀加盟元戎首秀,详解基座VLA,研发提效10倍
AI 深度提炼
  • 基座VLA模型分为驾驶、分析、评估三部分,解决多任务问题。
  • 数据表征和质量评估优化了自动驾驶数据闭环流程。
  • 物理AI核心在于闭环机制,驱动多领域智能化发展。
#自动驾驶#大模型#物理AI#元戎启行
打开原文

DeepSeek阮翀加盟元戎首秀,详解基座VLA,研发提效10倍 – 量子位

[](https://www.qbitai.com/)

[](javascript:void(0))

扫码关注量子位

Image 1

[](https://weibo.com/qbitai?is_all=1)

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

DeepSeek阮翀加盟元戎首秀,详解基座VLA,研发提效10倍

!Image 2: 一凡_[一凡](https://www.qbitai.com/author/yifan "由 一凡 发布")_ 2026-04-26 12:16:23 来源:量子位

V4作者之一

一凡 发自 副驾寺

智能车参考 | 公众号 AI4Auto

前DeepSeek核心成员**阮翀**,加盟元戎后首次亮相了。

Image 3

**阮翀(chōng)**,本硕均毕业于北京大学,早年从事NLP研发,2023年加入DeepSeek,参与了DeepSeek VL、V3和R1等工作,是**VL2的通讯作者**,也是最新发布的**V4的作者之一**。

!Image 4△图源:DeepSeek V4论文

如今他以新身份**元戎首席科学家**,现身北京车展,分享了元戎如何利用40B基座模型,**评估模型表现,用模型迭代模型**的过程。

Image 5

这意味着**AI不再是被训练出的结果,而是训练系统本身的组成部分**。这也是AI领域当前的趋势。

比如,同样是在自动驾驶行业,小马智行最近发布世界模型2.0,就具备自我诊断能力,可以实现自我强化。

再比如,OpenAI今年在发布 GPT-5.3 Codex时透露,该模型的早期版本,加速了其自身的开发进度。

**在数字世界和物理世界,AI都初步呈现出自我进化的趋势。而能同时深刻理解这两个领域的人才,非常稀缺,阮翀正是这样一位罕见的人才,从LLM转身自动驾驶,横跨两大领域。**

阮翀详解基座模型,元戎研发提效10倍

据阮翀介绍,过去自动驾驶研发,会选择用很多小模型,专门解决不同的问题,这给开发和管理,带来了很多挑战。

所以,行业正在向统一基座模型收敛,**用一个大模型,分化出多个不同版本**,解决几乎所有问题。

Image 6

其中元戎的基座模型,是一个40B参数规模的VLA(Vision-Language-Action Model),可以拆分成三个部分来看:

  • **驾驶模型**:AI司机,专门负责开车
  • **分析模型**:AI分析员,分析和解释AI司机为什么这么开
  • **评估模型**:AI教练,评估AI司机开车的表现
Image 7

基座模型如何落地,加速元戎开发呢?阮翀举了三个例子。

第一个例子是**数据表征**任务。自动驾驶研发的关键,是实现数据闭环,但阮翀认为过去**数据驱动的方式,其实带有滞后性**:

你必须先训练出模型,才能发现模型的问题,进而知道哪些数据不够。

数据表征则改变了这个顺序,它可以提前分析数据,并进行归类,这样研发团队**在训练前**就知道,自己手头什么场景的数据多,又缺什么场景数据,在训练时就可以有所侧重,调整数据配比。

第二个例子是数据质量评估。过去分析数据质量,需要通过间接方式,根据这批数据,训出的模型表现,反推数据质量,迭代周期比较长。

现在基于一个庞大的基座模型,只需要进行简单的微调,就能**评估数据质量**。

最后,基座模型不仅在数据维度实现了提效,同时也加快了**模型评估**。过去评估模型能力,主要依赖路测,要先更新模型上车,再找人跟车,实测后回传数据,这种方式费时又费力。

现在利用云端虚拟环境,就能评估模型,判断AI司机开得好不好,并进行修正。

Image 8

据阮翀估计,以前迭代一版模型可能需要100多个小时,**现在加速了10倍**,迭代时间缩短到了十几个小时。

在详解技术成果后,阮翀还参与了圆桌讨论,回应了外界最关心的问题:

**为什么他会加盟元戎,转向物理AI?**

以下是圆桌实录,经编辑

阮翀回应入局物理AI

**Q:什么才是物理AI?**

**阮翀**:从**狭义**的角度讲,**物理AI一定要有一个现实载体**,比如人能操纵它,然后现实世界会给出反馈,像机械手或者车。

但我认为物理AI最重要的事其实是闭环。

所以从**广义**的角度讲,比如说**AI Coding**,写了代码然后编译器会给出反馈,告诉你这个地方写了对不对,然后你再去调试。

只有这样的一个闭环,才是AI真正进入物理世界的最重要手段,能够让它不断提升。

**Q:什么情况让你意识到了大模型的能力边界?**

**阮翀**:我认为视觉模型现在最难的问题是**空间方位感知**,经常前后左右不分,然后导致一些奇奇怪怪的行为,比如分不清车门在左边还是右边,东西在车内和车外。

**Q:哪些领域的突破性进展,值得大模型借鉴?**

**阮翀**:我想强调的一个概念还是**闭环**。**我觉得这个问题可以反过来看**,就是如何把LLM推广到其他领域,比如用AI去预测化学分子性质,比如它的熔点或溶解度,然后用这项技术,加速药物研发。

Image 9

**Q:我们如何保证AI发展,是对人类有利的?**

**阮翀**:我个人现在非常赞同Harness(约束AI边界的系统工程)的概念。人需要法律和规章制度,保证他成为一个好人。

对AI也是一样的,如果你坚信AI能超越人,那么你也需要一些工具来控制它,而不是期待它性本善。

**Q:为什么近期不少LLM公司的多模态负责人,入局物理AI?**

**阮翀**:对我来说,我觉得有两方面的原因:

**第一,我自己不太喜欢做边际收益递减的事情**。我觉得做LLM很多年了,当然它的能力在不断提升,但和ChatGPT刚出来时,感觉已经完全不一样了,有一种疲倦的感觉。

LLM发展非常好,比其他领域领先,一个模型几乎可以解决你想要的所有事。

但在别的领域,比如多模态或者具身智能,还没有发展到这样的阶段,**我自己更愿意参与这样的阶段,而不是进入一个相对成熟的阶段**。

**第二,我自己性格的原因**。我不喜欢跟别人抢着做事,比如LLM很好,那大家都一窝蜂去做,但**我更在意某种使命感或者责任感**:

**一件事情,如果我去做和我不去做,对世界来说都没有差别,那我为什么要做?**

所以,我选择换一个领域。

_版权所有,未经授权不得以任何形式转载及使用,违者必究。_

元戎启行

![Image 10: 一凡[一凡](https://www.qbitai.com/author/yifan "由 一凡 发布")](http://www.qbitai.com/2026/04/407465.html#)

  • [Momenta曹旭东:规模L4要百亿美元投入,现金流业务是物理AI门票](https://www.qbitai.com/2026/04/407485.html "Momenta曹旭东:规模L4要百亿美元投入,现金流业务是物理AI门票")_2026-04-26_
  • [华为发布ADS 5!强化世界模型路线,今年投入180亿](https://www.qbitai.com/2026/04/407363.html "华为发布ADS 5!强化世界模型路线,今年投入180亿")_2026-04-25_
  • [燃油SUV车主熬出头了!华为乾崑智驾加持,全新奥迪Q5L率先实现智能化](https://www.qbitai.com/2026/04/406960.html "燃油SUV车主熬出头了!华为乾崑智驾加持,全新奥迪Q5L率先实现智能化")_2026-04-25_
  • [11.58万,全系Lidar+L4同源算法,广汽文远把城区NOA打成白菜价](https://www.qbitai.com/2026/04/402440.html "11.58万,全系Lidar+L4同源算法,广汽文远把城区NOA打成白菜价")_2026-04-17_

扫码分享至朋友圈

[](https://service.weibo.com/share/share.php?url=https://www.qbitai.com/2026/04/407465.html&title=DeepSeek%E9%98%AE%E7%BF%80%E5%8A%A0%E7%9B%9F%E5%85%83%E6%88%8E%E9%A6%96%E7%A7%80%EF%BC%8C%E8%AF%A6%E8%A7%A3%E5%9F%BA%E5%BA%A7VLA%EF%BC%8C%E7%A0%94%E5%8F%91%E6%8F%90%E6%95%8810%E5%80%8D&appkey=4017757111&searchPic=true&ralateUid=6105753431 "分享到新浪微博")[](http://www.qbitai.com/2026/04/407465.html)

相关阅读

![Image 11](https://www.qbitai.com/2025/08/326604.html)

#### 元戎率先供应VLA方案!打掉车企数亿自研预算,下探至10万级车型

支持纯视觉,多芯片平台

一凡2025-08-27

元戎启行车圈最新认知

![Image 12](https://www.qbitai.com/2025/04/271998.html)

#### 元戎启行联合高通基于骁龙智驾平台发布高阶智驾解决方案

涵盖激光雷达方案和纯视觉方案

一凡2025-04-08

元戎启行车圈最新认知高通

![Image 13](https://www.qbitai.com/2024/05/141575.html)

#### 对话周光:L4不存在了,L2、L3然后L5

端到端重写自动驾驶秩序?

一凡2024-05-13

元戎启行无人车往哪里开?自动驾驶车圈最新认知

![Image 14](https://www.qbitai.com/2025/12/365580.html)

#### 长城首个VLA车型发布,魏建军回应「赌上姓氏造车」

英伟达“芯皇”Thor上车

贾浩楠2025-12-23

VLA元戎启行长城汽车

![Image 15](https://www.qbitai.com/2025/11/354283.html)

#### 对话周光:特斯拉路线能Scaling Law,Waymo到今天也在发展

冲刺1年交付100万台城区NOA

一凡2025-11-19

元戎启行车圈最新认知

![Image 16](https://www.qbitai.com/2025/03/266241.html)

#### 对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025

VLA年中量产,加速迈向物理AI

一水2025-03-21

元戎启行

热门文章

![Image 17 #### 刚刚,GPT-5.5发布!内测英伟达工程师:失去它像被截肢 2026-04-24](https://www.qbitai.com/2026/04/406221.html)

![Image 18 #### 前小鹏汽车自动驾驶一号位李力耘出任众擎CTO,加速打造具身大脑 2026-04-21](https://www.qbitai.com/2026/04/404124.html)

![Image 19 #### 河南师傅,左手扳手,右手飞书,竟然能搞数据分析! 2026-04-23](https://www.qbitai.com/2026/04/406191.html)

![Image 20 #### 硬刚GPT-Image-2!国产AI生图“天花板”又被捅破了? 2026-04-25](https://www.qbitai.com/2026/04/406994.html)

![Image 21 #### 物理优先+VLA闭环进化:高德ABot-World世界模型,破解具身智能零样本泛化难题 2026-04-21](https://www.qbitai.com/2026/04/404086.html)

扫码关注量子位 ![Image 22](javascript:void(0))[](https://weibo.com/qbitai?is_all=1)[](https://www.zhihu.com/org/liang-zi-wei-48/activities)[](https://www.toutiao.com/c/user/53624121633/#mid=1556041376883713)

[](http://www.qbitai.com/2026/04/407465.html#)追踪人工智能新趋势,报道科技行业新突破

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司 京ICP备17005886号-1