自动驾驶攻破的难点在哪,何时能到 Level 5?

  不久前新一代 A8 装载了 Level3 级别的自动驾驶技术,距离完全自动驾驶 Level5 还有些距离,想问下自动驾驶想要攻克的核心问题是什么?何时才能达到最高级别 Level5 的无人自动驾驶呢?

  自动驾驶技术被视为引领新一次汽车工业革命的灯塔。无论是业界专家还是各路媒体都相信,自动驾驶的实现将颠覆的不仅仅是汽车本身,而是整个汽车工业。

  但现实中我们看到的是, xx公司在公共道路进行自动驾驶测试被约谈”、“xx公司自动驾驶事故致死”这样的标题不断出现在新闻中。而业界第一款具备真正意义上的自动驾驶能力的量产车——全新奥迪A8今年7月才姗姗来迟。作为整个自动驾驶的第一个量产玩家,奥迪尽管已经走在了行业最前沿,但目前实现的还是3级的自动驾驶,也就是说这是一种在限定环境条件下,需要驾驶员始终有接管能力的自动驾驶,距离无限条件无需接管的自动驾驶还有相当长的路要走。回头看历史,猛然发觉第一届DARPA自动驾驶挑战赛已经是十年前的事了。对比互联网产业,十年前支付宝还没有手机支付业务,而微信根本还没诞生,再看现在,支付宝和微信已经全面占领了我们的生活。为什么汽车工业的动作慢如蜗牛?自动驾驶到底难在哪里?

  在这里我不打算讲传感器技术、深度学习算法和功能安全等级这些晦涩的话题,这些属于典型的“懂的人自然懂,不懂的人说再多还是不懂”的内容。我想换一种讲述方法,不提具体技术,通过分析一个典型场景——开车去超市。和大家分享自动驾驶的技术难点,并说明这些难点存在的原因。

  从家里开车去超市,这是一个普通司机脑子里想着购物清单、嘴里哼着歌就能轻松完成的任务,可至今没有任何一家企业能够量产这一级别的自动驾驶系统。那么让我们分析一下,为了达成这一任务,一个人类驾驶者完成了哪些任务,而这些任务就决定了汽车需要具有怎样的能力。那么,我们的故事开始了。

  “松开新买的G29,你发现自己不在纽博格林北环,而是在家里。从老婆那里领取指令,要去超市买牛肉、抽纸、洗衣液还有水果。

  下楼,上车前绕车一周,确认没有什么小孩小猫小狗蹲在车边甚至躲在车下,四个车轮都在,也没有瘪掉。发动汽车,沿着小区内部道路到达公共道路,发现门口的道路正在养护,之前的双向四车道封闭了半幅,有些拥堵,等了五分钟才艰难地插入车流。

  不过今天是周末,主路上倒是很通畅。阳光很好,路上树影斑驳。

  这条路是贯穿整个城市的主干路,有些年头了,标线磨损很厉害,有些路段只是勉强能看清。而且由于这条路正在分段拓宽,路口的导向箭头也有修改,例如以前的直行+右转箭头现在改成了右转箭头,可以前的直行箭头部分并没有完全擦除,依然隐约可见。不过导航上已经更新了这个路口的导向车道信息。

  开车上路永远都有一些莽撞的司机,并线前不打转向灯、实线并线、连续并线,或者很近的距离切入,这种时候还是选择安全第一,能让就让。

  终于快到超市了,停车场入口一如既往排起了长队。前面那辆卡车车厢尾部的贴了大幅擎天柱的拉花,想来这是卡车司机自己的车吧,所以会在外观上彰显出自己的爱好。

  好不容易到了入口,可是一个老大爷站在路边,似乎是想横穿道路,那么我停一下,让他先过去吧!

  终于进了停车场,开始找车位。呃,转了三圈,一个车位都没有,保安过来指挥,说靠那边的墙停车就行,现在高峰期,超市停车场也会变通一下规矩以方便客户。”

  读完这么一大段之后,我们一起分析一下,在去超市这个普通的驾驶任务中,自动驾驶系统都会受到哪些挑战。

  一般而言,自动驾驶系统的任务可以分为三类:感知、决策和执行。

  对于感知,目前使用的主流传感器包括摄像头、毫米波雷达、超声波雷达和激光雷达四种。其中超声波雷达就是我们日常说的“倒车雷达”。每款传感器都有自己的优点和缺点,他们的缺点就导致了感知环节的技术难题。

  对于摄像头的性能局限有个简单的一句话判定方法:目前最好的摄像头仍然无法达到人眼的识别能力。也就是说,你看不清的,你的车也看不清。例如目前的环视摄像头并不能够真正覆盖车身360度范围。仔细观察屏幕显示会发现靠近车身的那一圈,特别是四角位置,其实并未显示外界真实图像,而且在靠近车辆的地方图像扭曲严重。而前视摄像头则无法分辨前方的黑色区域到底是影子还是路面破损,所以奥迪A8的自动驾驶需要有前车作为引导,从而确认路面是能够正常通行的。(也许你会觉得,还得跟着前车才能使用自动驾驶,那有什么用?但是请别忘了,这套系统本来就叫交通拥堵自动驾驶啊,堵车的时候当然有前车了,不然还叫什么堵车对吧?而且具备L3功能的A8在正常交通情况下,还有全速ACC和LKA来降低驾驶者的工作量,总体而言和目前其他所有L2级别的自动驾驶相比,都有了质的飞跃)。当阳光斜射的时候,护栏的阴影也可能被当作车道的边缘。在阴天的时候,灰色的车辆也经常无法被准确识别。如果遇到画着京剧脸谱的车尾,可能就因为匹配不到摄像头的车辆识别模板而判断前方并不是一辆汽车。

  此外摄像头和人眼一样,对外界光照条件的依赖非常强,晚上看不清,被阳光直射看不清,进出隧道的一瞬间也会瞎掉。而且受限于数据处理能力,摄像头的分辨率和帧率也都会受到限制。人眼能够轻松地识别200米外的车辆,在时速超过200kph的时候也不例外,但这对目前的摄像头技术而言简直是不可完成的任务——200米外的车辆可能只是几个像素点。同理,在中国目前不少车载摄像头都无法准确分辨限速标志和限重标志——那个t字实在太小了。

  而毫米波雷达并不像多年前的科幻电影里那样在一块绿色的圆形屏幕上一条线转啊转,然后目标就清晰地显示出来。雷达看到的其实是一大片强度不同的反射点,并且物体的几何形状和材质都会影响到反射点的反射强度和数量,同时还有部分雷达波在各个物体之间发生多次反射之后才回到接收天线。打个比方,雷达波更像是手电筒发出的光,而不是激光笔的效果。这导致特别是在远距离,雷达无法准确判断前方车辆的横向位置,甚至无法分享前方是一辆车还是两辆车并排行驶。雷达的上述特点导致结果就是原始数据中会出现大量的“假”目标,需要通过目标识别和跟踪算法做进一步的处理才能取得可以接受的效果。

  激光雷达在厂商的各种宣传视频中看起来似乎无所不能,通过激光扫描直接得到了世界的三维模型。但其实多数激光雷达在距离30米的情况,在一个身高1米8的行人身上就只能照射到6条线了,可以简单理解成通过6条窄缝观察一个行人。因此如果没有很好的识别算法,其实依然很难分辨出目标。而且如局座所说,激光雷达和摄像头一样,同样会受到烟雾或者尘土的影响而导致性能下降,甚至失明。

  但相比决策环节,感知环节的问题看起来简直不是问题。

  如果世界一瞬间只有自动驾驶车辆存在,那么情况会改善许多。但事实上,自动驾驶车辆和非自动驾驶车辆甚至行人将在很长一段时间共享道路使用权。在加入人这一因素后,道路的交通情况变得格外复杂。上面的场景中有一个简单的例子:过马路的行人。

  对于人类驾驶员而言,如果看见一个行人面朝公路,则可以判断他很可能要横穿马路,从而可以预先做出反应——变道、减速让行或者加速通过。而如果两个行人站在路边面对面聊天,人类驾驶员就会假设他们没有横穿马路的意图,保持正常行驶。对于目前的自动驾驶系统,这无疑是不能完成的任务。由于行人的前进方向和速度都可以快速变化,再考虑其他车辆或基础设施的遮挡问题,面向行人的自动紧急制动或者转向都是非常困难的事,所以奥迪A8的L3自动驾驶系统,依然把使用场景限制在仅有车辆通行的封闭道路上。

  还有上面的故事里提到的停车场保安的临时安排,对于人类驾驶者来说,这是一个理解自然语言就能解决的沟通问题,但保安如何与自动驾驶汽车沟通?手势还是自然语言?抑或是通过安装智能设备?这些不仅仅是自动驾驶汽车本身的问题,更取决于停车场这类基础设施建设的策略和投入。

  此外执行环节也是攸关安全的关键技术——不同于传统的执行机构,线控转向、制动和油门如果发生电子系统或者执行机构失效,将导致灾难性的后果。对于自动驾驶车辆而言,执行器不但本身需要具有极高的可靠性,还需要准备一套冗余的系统应对主系统失效的情况,比如转向系统会使用两个助力电机、制动系统在电子助力系统失效的时候还能够用ESC产生制动力。

  考虑天气变化,例如突如其来的暴雨,照明条件,例如泛滥成灾的远光狗和东升西落的太阳公公,其他车辆的错误,例如坡道溜车的新手司机等等。

  最后,我们还需要考虑到,自动驾驶是否能够全面实施终归是一个社会问题。比如:自动驾驶车辆对交通的影响一定是积极的么?

  先别急着做出肯定的回答,因为新技术小规模使用时带来的便利,在大规模量产后可不一定。

  特斯拉的某个宣传视频中,当车主把车随手停在路边去办事时,交警试图贴违章罚单,这时车开始一点点向前挪动,绕着车主指定的大楼缓慢行驶。看完这个视频大家第一反应是终于解决了短时停车难的问题。但请设想当这种技术大规模普及时的场景:整个CBD地区所有道路上充满了慢慢挪动的汽车。工作时间要前往机场的人们试图步行离开这片钢筋水泥丛林后再打车。好不容易打到车你却发现又堵在了学校门口,跟等着接孩子回家吃午饭的汽车保姆们以秒速五厘米享受慢生活。

  有人认为如果自动驾驶带动了共享汽车的发展,那么车辆的数量将会大大减少,如此以来,交通环境就会得到改善。然而当我们仔细考虑这个问题的时候,不难发现,其实现在路上的汽车数量取决于交通需求和交通方式,而不是汽车数量。如果交通需求不变,并且交通方式依然是长度5米的5座汽车,那么堵在路上的车并不会明显减少。

  最后一个需要考虑的问题是:如果电脑被黑了,可能会丢失资料,如果汽车被黑了,会发生什么?

  目前主流汽车的网络系统基本可以认为和外界是物理隔绝的,特别是涉及到行车安全的网络,例如动力系统控制网络、转向系统控制器、制动系统控制器、车身稳定系统控制器等等。也就是说,如果不通过设备物理连接到车辆,基本无法修改或者控制汽车涉及到行驶安全的系统。

  然而,为了实现汽车自动驾驶,将汽车接入互联网是不可避免的技术需求,否则将无法实现车车通信、车和基础设施通信并实时控制车辆行为的目标。这样一来,网络防护就是很现实的问题了。当我们的PC还不能保证绝对安全的时候,真的可以放心地把汽车连接到网络么?

  附加彩蛋问题:你妈和你媳妇都掉水里了……这种欠抽的问题在生活中可一点都不少:例如一群违章横穿公路的儿童和一个站在路边等红灯的老人,碰撞已经无法避免,你如何选择?这就不是一个用算法能够解决的问题了。考虑到汽车制造商需要为因自动驾驶功能而引起的事故负责,如果不能从社会伦理和法律方面解决这类问题,即使政府不禁止自动驾驶汽车上路,汽车制造商也不会走上这条可能使自己破产的道路。

  目前自动驾驶技术的大规模使用仍然路漫漫其修远,但是没有人会否定这是汽车这一古老的交通工具的未来之路。相比于特斯拉混淆视听的L2功能,具备L3功能的奥迪A8的量产,真正打响了自动驾驶革命的第一枪,也让我们有了更充分的信心,期待着整个汽车生态的迅速颠覆。

  最后夹带一点私货:“希望在我退休之前,路上不再有不打转向灯就变道的宝马,阿门。”