CICV 2023 | 美团自动驾驶刘博聪：无人配送足够安全的话规模扩展不会遥远

创闻用户 2023-07-28 14:32:15

编者按：5月16日，由中国汽车工程学会、国家智能网联汽车创新中心、北京经济技术开发区管理委员会、清华大学苏州汽车研究院主办，中国智能网联汽车创新联盟承办的2023中国（亦庄）智能网联汽车科技周暨第十届智能网联汽车技术年会（CICV 2023）在京开幕。本届活动为期四天（5月15-18日），共设1场闭门会、3场主题峰会、18场专题研讨会，同期将举办产业投资峰会、智能网联汽车行业创新成果展、第二届“智行杯”C-V2X车路云一体化实践、科技创新发布、中国智能网联汽车产业创新联盟年会等活动，吸引来自300多家国内外机构2000余位专业代表参会，共享全球实践、凝聚行业共识、促进产业发展、探索技术创新、强化生态建设、推动应用落地。

在5月16日“自动驾驶商业化推进”主题峰会现场，美团自动驾驶配送部算法负责人刘博聪发表了演讲，以下内容为演讲全文。

刘博聪：各位专家、各位领导，大家好。我是来自美团自动车配送部的刘博聪，今天非常荣幸有这个机会，在这里跟大家分享。今天分享的题目是“自动配送商业化中的安全保障实践”。

之所以选择这个题目，主要有两个原因：一是安全第一，我觉得这是大家的共识，而且也是贯彻自动驾驶发展永恒不变的主题二是现在越来越多的车辆开始车内去安全员的运营和测试，但是对于自动配送形态来讲，它从第一天开始车内就是没有人的。我们经历了从一开始十几辆车的规模，到现在上百辆车的运营和测试，这背后的一些探索经验，希望今天借这个机会可以和大家分享。

今天大概的内容分为两个部分：一是跟大家介绍一下末端配送场景的挑战，以及美团商业化这方面的进展二是在挑战和进展背后的一套完整的安全保障体系。

首先先看一张图片，这是亦庄典型的美团自动配送场景，非常漂亮，这个和大家印象中的自动配送场景比较类似，一个可爱的小黄车在辅路的场景，周围的交通不是很多，没有太多的交互，行驶速度也比较慢。但是对于经常做末端配送的人来讲，这是比较理想的状况，真实的末端配送场景是什么样？接下来通过几个视频和大家分享。

这是亦庄晚高峰自动配送视频，过路口的时候需要走人行道，可以看到有很多非机动车和行人的交互。

这是顺义的祥云小镇，这是比较密集的商圈，这个场景下我们的车和机动车是一个车道，本身的场景和密度比亦庄更丰富一些。

这是深圳坪山自动配送场景，深圳坪山自动配送车主要行驶在主路上，最高速度是45公里每小时，平均速度超过了20公里每小时。

这是另一个美团自动配送的典型场景，校园场景，校园是半封闭非结构化道路居多的场景，在这种场景中密集的行人和密集的非机动车交互，要远远比公开道路多很多。

除了刚才几段视频，对于末端配送来讲我们行驶的路线大多是在辅路和非机动车道上，形形色色的障碍物，比如像地面的杂物、水坑，地面的坑洼，以及旁边停置车辆突然有人开车门下车，以及相关的鬼探头的场景，远比主路道路上发生的频率高很多。

在这种相对来说特别复杂的情况下，我们是如何保证技术可以持续迭代的？经过过去的几年探索，我们形成了这样的一个技术迭代飞轮，比较简单主要包含三个部分：安全、成本和体验。安全这里不过多说了，成本这里主要指人力成本，反映到指标上大概是车人比的指标，原来在车内有人的时候，车人比是1：1，后续车内没有人的时候，把人迁移到云端安全员的形成下还是1：1。但是这种1：1的比例显然不能满足商业上有价值的成本要求，持续的提升人车比，降低成本是商业化必经之路。体验对于配送来讲反映在平均速度上，大家点外卖的时候希望半个小时送达，不希望换了自动配送花一两个小时把外卖送到你的手中。在安全和成本的要求下，还要不断地提升自动配送的平均行驶速度，保障用户体验，最终才能体现它的商业价值。可以看到这三点相互制约、相辅相成，当成本降低、体验提升的时候，注定会有更多安全风险，我们要持续的对安全进行相关的保障，才能促进最终的规模化落地。

接下来这一串数字代表了美团自动配送最近的商业进展，月均行驶里程超过了20万公里，其中自动驾驶比例超过98%，这里要强调一下，这里的20万公里是车内无人自动驾驶。平均速度和最高速度分别是16公里每小时和45公里每小时，累计到今天我们完成了超过300万单的末端配送单量，覆盖的社区超过了100个。

最为重要的是，在这些背后我们到目前为止，没有任何一起自动驾驶主责的安全事故发生。

在这样有挑战的场景，有进展的背后有一套比较完善的安全保障体系，接下来我从算法设计、软硬件系统、研发流程和运营机制上分别跟大家介绍。

先从算法设计讲起，最近特别流行的一个事情是大模型，很多朋友问我大模型出现了，是不是自动驾驶就跌幅了？自动驾驶就成功了？我也问了一下大模型，问了一下ChatGPT是不是这样？答案不是。在现实的复杂场景下，我们通过使用多模态的数据，包括图像、点云，甚至是离线的高精地图，保证了数据的完整和完善性。只有在这样的数据保障下，我们通过多层级的算法设计，举感知检测模块为例，我们有障碍物级别的检测，有点级别的检测，还有基于几何信息的Robobox。从上到下可以看到，它越来越偏规则，偏可控性，从下到上可以看到它越来越偏数据驱动，同时可规模化的能力越来越强，只有通过多层级的保证，我们才能通过不断地降低风险概率，让算法最后满足自动配送的要求。

这是大概感知效果的展示，可以看到从图像点云的角度来讲，我们去做对应的检测任务，做对应的分割任务，最后把结果融合形成最终的感知结果。

除了算法以外，整个的软硬件系统也需要做到足够的安全，这背后最重要的一点就是冗余性。在主系统我们使用了PonyMADC方案，使用了两个双计算平台，主节点和辅节点互相监控，当任意一个节点发生问题以后，任意一个节点都能完成相对来说比较完整的自动驾驶任务，从感知到最后的刹车。除了主系统外，还有一个完全的传感器冗余、算力冗余的辅助系统，用的是地平线方案。在这个系统上，我们同时有MAB系统，它保证了用简化版的感知更快速的刹车链路，当主系统发生故障完全失联的情况下，还可以保证车辆可以完成缓刹和靠边停车的行为。车端的云控系统负责和云端监控体系、监控平台进行实时数据通信，保证当自动驾驶出现问题的时候，云端对整个车辆还是可控的。

除此之外，我们还有机械上的保障，比如说像前置的防碰撞，即使是任何一个计算平台都挂掉了，当它发生触碰的时候，也可以通过直联VCU保证刹车。

如果算法和系统都做到了非常安全，是不是自动驾驶就足够安全了？又问了一下ChatGPT其实不是的。当自动驾驶这样一个复杂的系统，同时又上百名工程师在算法或者系统上同时工作的时候，有一个比较规范、完善的研发链路是至关重要的。经过过去的几年探索，我们形成了一套完整的研发体系，从路测运营问题的发现，到问题的解决，工程师的问题验证，包括离线的仿真云端大规模的测试，到后续的发版，以及对应的算法能力，反馈在运营和路测自动驾驶版本上，形成了一套完整的闭环。

这里举个发版流程为例，包括三个方面，安全、效率和成本，通过Canary-Devel-Beta-Release多层级流程，在保障足够安全的前提下，可以不断地完善测试的覆盖率。测试的范围和路线是从封闭场地到复杂道路，由简单到难，测试时段、速度和车人比也都是从简单到难的过程，并不是一开始就把有风险的研发版本铺到所有的测试和研发车上进行测试，一定是有层级的测试架构。

即使是自动驾驶算法保证了足够的安全，是不是自动驾驶运营就有足够的安全保障？其实也不是。类似这样的场景，当交互的对象有不合理、不符合预期的行为，比如趴车，比如和车发生接触的行为，每天都在运营和测试路线上发生。当这种问题发生的时候，我们通过建设完善的运营机制，通过人去确定这些风险是否是自动驾驶导致的，以及避免风险持续的扩大，都是至关重要的。这后面是一套非常完善的运营安全保障机制，我们通过多重角色保障自动驾驶行驶周期安全，有云监控负责在途的风险监控，云辅助帮助车辆简单的脱困，云代驾在风险场景下可以介入进行车辆的完全驾驶，以及对应的区域安全员，当车辆真的无法连接或者无法通信的时候，区域安全员可以保障及时到事故现场处理。

可以看到从上到下不同角色起到的安全兜底能力是越来越强的，刚才也说到了，增加人的情况下自然而然就会带来成本的增加，所以不同的角色在成本上是不一样的。从下到上成本是越来越低的，云监控角色可以通过更廉价的界面或者操控形式，一个人去监控更多的车辆，保证成本仍然是可控的。

这里是不同的角色使用界面，左上角是云监控使用的界面，可以看到它有比较全局的视角，可以看到所有的车辆，可以选择车辆或者给他推送有风险的车辆进行监控。右边的视角是云辅助视角，它有更多的感知信息，同时它也有简单的操作按钮，比如可以直行，左绕行、右绕行、倒车，最底下是云控视角，和人驾车的视角比较类似，负责在有风险的情况下人介入进行人类驾驶。

这背后有两个保证，一是运营机制的完善保证，我们从事件发生上报、分层流转、响应、视频回溯、远程交互、事件归档有一套完整的SOP，保证运营能规范化的推进。刚才也提到了，当事件发生后响应的速度是非常重要的，我们建立了一套非常快速的数据流转流程，保证在10分钟之内，当风险发生之后就可以得到妥善的处理，避免事故的风险扩大或者是发酵。

这就是今天分享的主要内容，最后再说一下感想。

做自动驾驶时间比较长了，从开始的时候比较心惊胆战的看到车没有人在路上跑，到现在看到百辆车的规模车在路上，一个人看很多辆车跑，真正能够感受到自动驾驶规模化、商业化落地越来越近。但这个背后其实是比较完善的安全保障，只有它能保障足够安全以后，我们相信后续的千辆车、万辆车真的不会太遥远，感谢大家！

汽车