ChatGPT 的热潮,从年初炒到了现在。各行各业都在看相关的融合机会,不少“信徒”甚至放言,不出几年,人工智能就将取代人类!
这不禁令我想起了,几年前深度学习技术突飞猛进的时候,当时的一众汽车行业高管和技术专家也是这么吹的……
自动驾驶即将到来,人们以后都不用开车了,甚至车内都不会有驾驶座了,人们坐在车里放松一下,聊聊天,看看视频节目,甚至打个盹,过不了多久车就能自己把我们开到目的地了——在那样一个被自动驾驶技术完全革命的未来,汽车将不再是需要人操纵的机械,而是将变成纯粹的,带着人们从 A 到 B 的通勤工具。
【资料图】
然而,在几十甚至上百亿元的研发支出过后,当年那些人的豪言壮志,却并没有实现。很多从事相关研究的公司和团队也都减慢了步伐:
谷歌的 Waymo,项目启动很快之后就从纯无人的技术路线改成了 L3-L4 等级的“半自动” ,上路至今已经七八年却仍然处于测试阶段,无人出租编队试营业的范围也极其有限业;通用旗下的 Cruise 在美国旧金山也上线了无人出租车队,大部分时候却只敢在大半夜运营,还几次因为违反交规、造成事故,以及车队在路口集体“蹦迪”而上新闻;去年,福特和大众关闭了他们合资研发自动驾驶的初创公司 Argo AI;特斯拉口中的“完全自动驾驶”(full self-driving) 也已造成多次恶性事故,面临美国交通安全监管部门的审查。今天再问任何一位货真价实的从业者,他们恐怕都得说实话:自动驾驶技术还没有发展到可以完全取代人类司机的地步。
而放眼汽车市场,目前消费者仍然买不到可以被认为具备完全自动驾驶能力的乘用车产品。实际上,目前自动驾驶技术仍然处在非常早期的阶段,能力非常有限,仍然需要后台人工的密切监控,以至于字面意义上的“自动驾驶”尚不存在。业界对自动驾驶技术成真的观念,从当年普遍乐观,到现在已经变成普遍怀疑,甚至有人认为以目前的自动驾驶技术方向恐怕永远无法实现终极的目标……
究竟是什么在拖慢自动驾驶技术的演进和全面普及?
自动驾驶系统需要硬件和软件共同工作。目前在硬件方面困难不大,无非是堆积更多的关键零部件,比如激光雷达。
但在软件——实际上也就是底层的人工智能算法技术的方面,目前自动驾驶系统的AI复杂程度远不及人脑。
按照汽车技术组织 SAE International 的自动驾驶等级定义,L5级别的全无人驾驶,汽车需要在任何路况、天气等外部情况下都可以自主行驶,能够处理一切有可能发生的情况,并且完全不需要人类接管。甚至在 L4-L5 的定义当中,方向盘、踏板等都不是必须安装的。L5 级别的自动驾驶系统,在底层需要一个具备人类水平的 AI。
然而就目前自动驾驶的 AI 系统来说,目前还远未达到完全和人类操作能力和应变能力持平的程度。更重要的是,在当前自动驾驶底层 AI 的研究领域,也还没有确立一个被普遍接受的技术路线,能够实现人类水平 AI。
经过多年的试错之后,绝大多数从业者现在都转变了思维。很多人现在认为人类水平的 AI 或许压根就是没有办法实现的,或者至少还需要数十年的时间才能够实现。尽管最近十多年基于深度神经网络和超大模型的人工智能技术突飞猛进,这样的技术生成文本、编故事,做图和做视频的能力已经很强,但仍然无法让 AI 在驾驶这件事情上接近人类的水平。
这也是为什么在今天,很多车企和自动驾驶技术公司已经调低了预期,改变了路线,加紧开发“高级辅助驾驶”类的技术,并且加快了在乘用、商用车市场上的商业化速度。
SAE International 的 J3016 文件对自动驾驶分级的基础定义
比如,在一些非常极端化和小样本的交通事件当中,目前绝大多数自动和高级辅助驾驶系统的应对能力都非常差。当摄像头和激光雷达扫描到一个较少在城市道路出现的物体,比如一头牛、一只羊的时候,由于其底层的学习系统里面缺少这种小样本物体,它很有可能无法正确地对物体进行识别。
当然就算无法正确识别,它仍然能明白遇到了一个障碍,并且在驾驶过程中进行转向、减速等合理的规避操作。但是一头牛或者一只羊只是所有边缘案例当中的一种,除此之外还有无限多种我们至今都尚未遇到的边缘案例——指望基于传感器数据和深度学习底层的 AI 去处理无限多种可能性,并且维持驾驶场景所要求的极高的成功率和安全性,已经被证明是非常不现实、不经济的。
究其根本,人脑可以做毫秒级的复杂决策,这样的能力是来自于感官的输入、过去的经验、举一反三的能力等等。这些东西当中,只有一部分能够被自动驾驶系统通过硬件或者软件的方式去模拟。但是人脑的工作方式是上述所有这些东西的有机组合,目前是自动驾驶仍然无法模拟的。
目前 L3、L4 所需要的传感装置都已经存在。从业者也普遍认为只需要 AI 够强,当前的硬件配置足以实现 L5 自动驾驶。
但是在硬件层面,自动驾驶的推进目前遇到的最大的阻碍,是硬件的成本。
自动驾驶和高级辅助驾驶系统,通常需要包括车载计算机、摄像头、雷达、激光雷达、GPS 等硬件。随着越来越多的OEM和供应商加入到自动驾驶研发当中,这些硬件的价格变化基本也都朝着更加可接受的方向。比如摄像头以及配套的图像信号处理元器件,由于智能手机的推广使得成本已经非常低廉。
然而激光雷达,作为自动驾驶和高级辅助驾驶系统必不可少的元器件,其成本仍然较高。
我们今天在市场上可以看到,在20万元价位左右的汽车都已经可以搭载激光雷达。然而一个令人尴尬的问题,在于激光雷达的价格非常昂贵,中低端价位如果要上激光雷达基本都会赔钱(当然亏本卖车还有很多别的因素,此处不赘述)。
核心的问题,在于现在汽车市场竞争程度过于激烈,高级辅助驾驶就快要成为新能源标配,以至于品牌不得不亏本赚吆喝。然而一个不争的事实是,品牌希望实现的辅助驾驶水平越高、能力越多,需要的激光雷达也就越多,成本就只会越高。(更别提高级自动驾驶系统对传感器硬件冗余也有需求,意味着汽车要搭载比实际需要更多的传感器部件。)
结果就是,如果在一个基本理性的市场上,真正安全的高级辅助驾驶,甚至自动驾驶,在激光雷达价格高企的时代下,注定只会是一个高端价位消费者才能够享受的功能。只要激光雷达还被“卡脖子”,技术开放程度上不去,价格降不下来,自动驾驶也就无法真正得到全面普及。
而回到纯粹成本层面,乘用车搭载更多激光雷达的确不够经济;而在商用车领域,比如货运卡车、大客车、摆渡车等,可以用相对更高的使用率来对冲更多激光雷达造成成本。可以肯定地讲,我们肯定会在商用车领域见到自动驾驶和高级辅助驾驶功能更高的渗透率。
与此同时,在业界也有一些比较特立独行的乘用车品牌,采用的是无激光雷达,也即纯摄像头(或摄像头+常规雷达)+AI 的方案。实际上并不是因为纯摄像头方案就可以实现自动驾驶,而是采用这种方案更多是出于成本考量。
而这些品牌的相关功能在过去几年里引发的多起恶性事故,也已经通过血淋淋的事实证明了纯摄像头方案在L3-L4阶段已经不可取,更不大可能成为实现所谓“自动驾驶”的正道。
真正的自动驾驶,其普及不能只靠汽车自己。行驶环境里的道路信号系统和智能化以及和自动驾驶系统的连通性、兼容性,目前在全球同样面临挑战。
比如,如果交通信号灯能够向汽车直接发送当前信号,汽车就无需使用摄像头+图像处理算法来识别灯的颜色,一方面能够避免大雨大雪大雾灯严苛天气条件下的识别错误,另一方面也能通过了解前方灯信号来提前数百甚至上千米就进行路径规划。
再比如,在前面提到的一些边缘案例当中,有一种可能情况是道路临时施工导致的阻断和变道。由于道路情况不同,施工环境复杂等外部原因,汽车在遇到这种情况时往往无法准确识别路况,导致自动/高级辅助驾驶系统的操作信任程度降低,甚至系统脱离,不得不由人工接管。
理想条件下,如果在施工路段的前方拜访了相关的告示,并且这些告示能够和汽车系统进行信息交换,那么自动/高级辅助驾驶系统的应变能力将会得到较大提升。
在汽车层面,很多公司在多年前就已经意识到车联基础设施 (V2I)、车联万物 (V2X) 等技术的重要性,并且进行了相关的研发。然而在交通管理有关部门的层面,目前全国只有面积有限的城市和郊区道路正在试点相关的车-路信号通信系统。这些区域往往也是在已经和当地车企或自动驾驶技术企业建立合作关系的前提下,才会启动相关的信号升级项目。
范围扩大到整个中国,乃至全世界,绝大部分道路信号系统仍然无法和各家车企采用的五花八门的自动/高级辅助驾驶系统进行沟通。
车联基础设施 (V2I) 系统示意图
与此同时,就连车到车 (V2V) 的数据交换,在自动驾驶技术“百家争鸣”的今天,也在兼容性的层面遇到了的困难。
来自不同品牌、母公司、品牌联盟的汽车之间的沟通;在数据安全和交通安全法律法规的查一下,同品牌不同国家或地区的车辆之间的沟通……等等,都对汽车自动驾驶系统的互操作性设计以及车企的合规安排提出了极大的挑战。
结果就是,大部分的道路并没有面向自动驾驶汽车高保有率的未来,进行足够的优化,也缺乏相关方向技术升级的可行计划。如果只靠车企们自己却解决问题的话,结果可能会是适得其反的,也即自动驾驶渗透率越高,道路情况越复杂,交通事故反而会更多发生。
交通管理部门也很头疼:一方面他们的创新脚步要跟上自动驾驶技术的发展,另一方面又要提高对自动驾驶技术的监管水平和能力,同时还要在自动和人工驾驶车辆共享道路的现实条件下平衡各方的主张和需求……想想都是个大难题。
以上,就是目前自动驾驶技术推进和普及的最大障碍。显而易见,任何一条的解决都不是小工程,并且恐怕只有几条都得到解决,自动驾驶才能够真正“梦想成真”。