深度调查 | 智能驾驶走向十字路口:纯视觉路线“异军突起”,激光雷达未到“抛弃”时

时间:2024-11-04 阅读数:141人阅读

随着大模型等AI技术的不断发展,数据驱动的端到端方案逐渐成为行业的新宠,激光雷达这一曾被视为高阶智能驾驶系统必备组件的技术正面临挑战。

9月初,自动驾驶技术公司Mobileye宣布终止下一代调频连续波(FMCW)激光雷达的内部开发,为行业“去激光雷达”的论调再添一把火。

在智能驾驶领域,特斯拉CEO马斯克一直是纯视觉方案的坚定支持者。他曾直言,“只有傻子才会用激光雷达”。

这一观点随即遭到反击。华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东曾表示,“以特斯拉FSD(完全自动驾驶)为代表的纯视觉方案,上限很高,下限也很低”。

事实上,对于要不要抛弃激光雷达,当前业内的意见并不统一。“端到端是一种软件算法的技术,激光雷达是硬件传感器,两者完全可以共存。无论软件算法技术如何发展,对智能驾驶的实现而言,激光雷达必不可少。”速腾聚创相关专家对《每日经济新闻》记者表示。

但在极越CEO夏一平看来,想要实现端到端解决方案,纯视觉技术是目前的最佳选择。

不用激光雷达是为降本找理由?

作为纯视觉自动驾驶路线的坚定支持者,马斯克经常盛赞视觉的优越性,并三番两次怒怼“激光雷达昂贵且没有必要”。他认为,依靠摄像头和神经网络,结合强大的算法和算力,就能够实现高效且安全的自动驾驶体验。

有业内人士指出,以往特斯拉不使用激光雷达而走纯视觉路线,主要是因为当时处于行业发展早期,单颗激光雷达价格超过1000美元,这对于量产车而言过于高昂。

蔚来CEO李斌也曾表示,不同的阶段,激光雷达发挥的作用是不一样的,当特斯拉做Model S和Model Y时,国外的激光雷达价格高达几万美元,而特斯拉的车型售价并没有那么高。

然而,随着规模化量产以及价格战的持续进行,曾经价格高昂的激光雷达,价格也在迅速下降。上述速腾聚创相关专家向《每日经济新闻》记者表示,当前,量产激光雷达的成本已经做到500美元(约合人民币3500元)以内。预计到2025年,部分新产品的成本将降至200美元以内(约合人民币1400元)。

禾赛科技方面也向记者表示,其主力产品AT128系列(车规级超高清远距激光雷达)的售价今年将下跌10%~20%。

图片来源:禾赛科技官网

与此同时,车企的策略也开始分化。盖世汽车研究院报告显示,目前,越高等级的自动驾驶功能,对激光雷达越有更高的装载偏好,尤其在L2++领域,具备高速NOA功能车型的激光雷达装载率超60%,而城市NOA场景中这一比率更是接近100%。

另一方面,高阶智驾也在走向下沉市场。高端车型中,消费者对安全性和先进技术的需求更高,因此激光雷达成为标配。而在20万元以下的车型中,车企则倾向于采用成本更低的纯视觉方案,以吸引价格敏感的消费者。激光雷达作为智驾系统中成本仅次于智驾芯片的零部件,被砍掉后能够帮助车企省下大量BOM成本(Bill of Material Cost,指制造一辆汽车所需的所有原材料、零部件、组件以及其相关费用的总和),也能在价格战中占据主动权。

对此,极氪副总裁林金文提出了不同的观点。他认为,“激光雷达确实成本很高,但配合算法软件能实现的极致安全性,是纯视觉做不到的,不用激光雷达就是在为降本找理由”。

长尾安全场景下,激光雷达优于纯视觉

据记者梳理,纯视觉方案依赖摄像头捕捉的图像数据,并通过深度学习算法进行处理和分析,以实现环境感知和决策。而激光雷达方案则通过发射激光束来测量物体与设备间的相对距离,获取精确的三维环境信息。

2024年3月,特斯拉发布FSD V12版本,通过Occupancy+Transformer框架作为基础模型,实现了感知和决策规划两大模块的算法“端到端”。FSD V12的一个显著特点是,其99%的决策由神经网络给出,大幅减少了对硬编码编程的依赖。通过开发专门的计算机视觉模型和高分辨率摄像头,FSD V12能够在各种复杂的道路环境中准确识别车辆、行人和其他障碍物。

图片来源:每经记者 张建 摄(资料图)

夏一平认为,纯视觉方案的3D精度能达到厘米级,其感知能力甚至能超越主流激光雷达。激光雷达虽然能够探测到障碍物,但无法识别障碍物的具体是什么,无法实现自我成长和进步。而通过视觉方案,车辆可以像人眼一样观察世界,学习并记住不同的物体和它们的行为。

小鹏汽车董事长、CEO何小鹏也支持这一观点。他认为,端到端大模型能让智驾更加“类人”,并无限接近L4级别的自动驾驶。

然而,Momenta CEO曹旭东对此持有不同看法。他指出,在一些长尾的安全场景下,如暗光环境下的行人横穿,或是进出隧道时的光线变化,激光雷达的效果确实会更好,因为它提供了更稳定的光源和更精确的距离测量,从而带来更好的安全保障。

上述速腾聚创相关专家也强调了纯视觉方案在摄像头“看不见”或“看不清”的情况下的局限性。如,强光照射、夜晚弱光环境、前景物体与背景颜色相同导致无法区分等情况,这些都可能导致严重的事故。

此外,美国国家公路交通安全管理局(NHTSA)对特斯拉汽车的调查,也反映了监管机构对纯视觉方案安全性的关注。当地时间10月18日,在收到多起关于配备FSD功能的特斯拉车型的事故报告后,NHTSA宣布对241万辆特斯拉汽车展开调查。

纯视觉方案长期需投入更多资源

车百智库研究院的报告指出,智能驾驶任务可以通过规则算法和模型两种方式完成,前者由工程师人工定义规则,后者则基于数据训练迭代,也就是机器模式。特斯拉FSD的创新,在于其真正实现了数据驱动。

在数据驱动的体系中,算法、云端算力、数据和工具,共同决定了企业的智能驾驶技术水平。算法像是“菜谱”,云端算力是“燃料”,数据是“食材”,工具则是“厨具”。

夏一平认为,智驾背后一定是数据驱动的,一旦把数据驱动跑通之后,智驾能力迭代的速度会更加夸张。而对于追求高度泛化能力和端到端解决方案的品牌来说,纯视觉技术可能是目前的最佳选择。

以特斯拉为例,在算力层面,截至2023年一季度,特斯拉云端算力达到35 EFLOPS(简称E),超过华为车BU(3.3E)、百度极越(2.2E)、长城(1.64E)、蔚来(1.4E)、理想(1.2E)、吉利(0.81E)、小鹏(0.6E)等企业已公开自建算力总和的3倍。

图片来源:视觉中国

数据方面,公开资料显示,截至2024年4月,特斯拉全球保有量超过600万辆,FSD累计行驶里程已达12.5亿英里(20亿公里)。作为对比,小鹏汽车XNGP累计行驶里程为0.7亿公里。

此外,特斯拉采用纯视觉感知方案,各车型采用标准化硬件配置以保证采集数据的格式统一。根据车百智库研究院报告,特斯拉FSD累计学习的高质量视频片段已超过2000万个,这样规模的数据量仅采集成本就需要50亿~80亿元。

短期内,去除激光雷达可以降低成本。但从长远来看,车企需要为这一选择投入更多的研发资源。禾赛科技战略负责人施叶舟表示,成本不仅包括硬件成本,还应考虑背后的研发服务和资源投入,包括算法、路测、云计算、数据标注、仿真训练和系统软件等隐性成本。

轻舟智航产品负责人许诺也表示,现阶段单纯依靠视觉方案,很难应对中国城市道路中的各类Corner Case(边缘场景)。

视觉路线与激光雷达在相当长的时间内将并存

在自动驾驶技术的发展道路上,关于端到端纯视觉是否为终极方案的争论仍在继续。行业专家和车企高管们各执一词,观点不一。然而,从近期新车型的上市情况来看,智能驾驶方案呈现出分化趋势。

李斌曾明确表示过对激光雷达的支持。他曾称,“谁说激光雷达没用,肯定非蠢即坏”。尽管如此,蔚来也推出了采用纯视觉方案的乐道L60车型,起售价为20.69万元。

作为问界新M7系列的入门版车型,问界新M7 Pro全系标配了HUAWEIADS基础版,采用纯视觉智驾方案。

图片来源:每经记者 孔泽思 摄(资料图)

从各车企纷纷推出不同版本智驾方案的策略来看,激光雷达之于OEM,与其说是技术问题,不如说是商业问题。

曹旭东表示,智能驾驶正遵循硬件和软件的“摩尔定律”迅速发展。硬件方面,高阶智驾系统的BOM成本每两年减半。在2025年底或2026年初时,实现城市NOA BOM成本可以做到5000元左右。正是因为智驾“摩尔定律”,城市NOA、城市高阶智驾未来五年预计会呈爆发式的增长态势,比电动化、新能源化的速度更快。

“我们认为,端到端的视觉路线将与激光雷达方案在相当长时间内并存,各自发展。”上述速腾聚创相关专家表示,由于摄像头、激光雷达等传感器硬件物理原理的差异,导致单一特性的传感器无法保证收集到的环境信息的安全可靠,为了守护智能驾驶安全,在多传感融合系统中,激光雷达依然必不可少。