搜索历史清空

港股动态

瑞财经原创专栏,汇总香港上市公司动态。

小鹏与北大联手推出视觉Token剪枝框架

瑞财经 2025-12-28 19:26 758阅读

Ai快讯 12月28日,小鹏汽车公布信息。近日,人工智能领域国际顶级会议之一的AAAI2026公布论文录用结果。AAAI2026共收到23680份论文投稿,录用4167篇,录用率为17.6%。

由小鹏汽车和北京大学计算机学院多媒体信息处理全国重点实验室联合完成的论文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》入选。该论文提出专门为端到端自动驾驶VLA模型定制的高效视觉Token剪枝框架——FastDriveVLA。

随着AI大模型技术发展,VLA(视觉 - 语言 - 动作)模型因在复杂场景理解与动作推理方面有潜力,被广泛应用于端到端自动驾驶系统。VLA模型处理视觉信息时会将图像编码为海量视觉Token,其质量、数量与选择策略影响模型性能、效率与可信度。但直接转换处理方式会使车端计算负荷变大,影响模型推理效率和决策执行。

此前,视觉Token剪枝是加速VLA模型推理的方法之一,但传统视觉Token剪枝方法在驾驶场景中有局限。为解决该问题,小鹏汽车联合北大提出FastDriveVLA,这是基于重建视觉Token剪枝框架,受人类驾驶员专注前景信息启发,引入对抗性前景 - 背景重建策略,增强VLA模型识别有价值Token的能力,过滤无关视觉信息。

小鹏汽车联合北大提出FastDriveVLA,建立了自动驾驶VLA模型高效视觉Token剪枝新范式,树立车端大模型高效部署上车新标杆。

此次论文入选AAAI2026,是小鹏汽车2025年第二次参与人工智能领域国际顶级会议。2025年6月,小鹏汽车作为CVPR WAD唯一邀请演讲中国车企,分享自动驾驶基座模型研发进展。2025年11月科技日,小鹏汽车推出第二代VLA,去掉“语言转译”环节,实现从视觉信号到动作指令端到端直接生成,探索全新物理AI模型范式。

这些成果体现了小鹏汽车从模型架构设计、模型训练到模型蒸馏、部署上车的全栈自研能力。未来,小鹏汽车将以L4为目标,在AI大模型领域加大投入,加速物理AI大模型上车,让智驾体验惠及全球用户。

(AI撰文,仅供参考)

重要提示: 以上内容由AI根据公开数据自动生成,仅供参考、交流、学习,不构成投资建议。如不希望您的内容在本站出现,可发邮件到ruicaijing@rccaijing.com要求撤下。未经允许,任何单位或个人不得在任何平台公开传播使用本文内容。

相关文章

24小时热门文章

最新文章