陈黎明:用户价值驱动,推动智能驾驶技术创新和发展

  2023年7月5日-7日,由中国汽车工业协会主办的第13届中国汽车论坛在上海嘉定举办。本届论坛以“新时代 新使命 新动能——助力建设现代化产业体系”为主题,设置“1场闭门峰会+1个大会论坛+16个主题论坛+N场发布”共18场会议及若干发布、展示、推广等活动,旨在凝聚各方力量,形成发展共识,为建设现代化产业体系贡献汽车行业的智慧和力量。其中,在7月6日下午举办的“主题论坛一:第五届全球汽车技术发展领袖峰会”上,地平线总裁陈黎明做了主题演讲。以下内容为现场演讲实录:

  尊敬的各位嘉宾,各位来宾,大家下午好!
  非常荣幸受中国汽车论坛邀请来参加今天峰会。我演讲的主题是《用户价值驱动,推动智能驾驶技术的创新和发展》。
  过去这一年时间里,整个自动驾驶可以用两句话来形容,一个是回归商业本质,二是用户价值驱动。
  从很多调查数据看到,对于买车用户和已经使用过智能驾驶的用户来讲,对智能驾驶的最基本价值,主要还是驾驶安全、放心、轻松,缓解疲劳,这是目前自动驾驶最朴实、最迫切的需求。

  从智能产品价值上看话,智能驾驶已成为购买智能汽车的 TOP 3 因素,购买新势力汽车或者电动车的用户,智能驾驶的先进性已经成为他们决策的 TOP 2 要素。在整个市场上,大家越来越接受智能化,对于高级辅助自动驾驶的接受、认可度越来越高。

  用户的价值是通过用户的体验来实现的。但在目前市场上,实际性能还是参差不齐,也有一些大家感到体验不好的地方。
  一个是接管的频率还相对比较高,使用范围还相对比较有限。去年是高速 NOA 元年,在高速上变道、超车等慢慢都开始实现了,之前更多是在单车道上的一些辅助驾驶,整个自动驾驶的操控感并不那么平顺,包括启动、刹车、转向等,表现均不如老司机。再一个性价比还是不够高,大家花的钱跟得到的感觉有时候不成比例。
  体验差距的背后,实际上还是技术的挑战。

  挑战很多,简单总结几点:一是现有的算法,不足以支撑复杂场景的功能和性能。二是现有硬件有效算力和其带宽,不足以支撑最先进的算法和大模型,这也是硬件上需要去进一步发展的。三是现有软件架构,不足以支撑高度自动化的快速迭代,使得整个开发成本高,开发周期长。

  怎么解决这些问题?在这里分享一些技术发展趋势,以及我们的一些思考和创新解决方案。
  去年是高速 NOA 的元年,今年可能是城市 NOA 的元年。目前很多公司都在进行积极研发,个别车型已经推向市场,今年还会有更多城市 NOA 产品投放到市场。
  从整个发展路线来讲,地平线一直认为是一个渐进的发展,逐步去逼近用户体验的上限。现阶段最主要的,还是 ODD的扩展,也就是说从单车道到多车道,从高速到城区,从简单场景到复杂场景,不断的 ODD 使用场景的扩展。
  下一步会是接管表现的提升,并不是说现在接管次数就不重要,只是说目前的重点还是在扩展ODD。到 ODD 扩展到全场景后,下一个阶段的重点,才是如何提升百万公里接管次数的极限。

  这是地平线对于发展路线的认知,我们也是按照这样一个发展路线,来开发设计我们的产品。

  接下来分享一下开发范式上的发展。
  从 software 1.0 到 software 2.0,基于规则的算法已经遇到了它的一个上限,没有办法解决自动驾驶碰到,很多感知相关的问题。
  于是深度学习应运而生,更多应用在自动驾驶的感知,还有其他一些模块里。另一个趋势,就是深度学习的神经网络,在更多的模块里使用。除了在模块里使用外,还有端到端的大模型的使用也在不断地扩展。

  这使得整个自动驾驶的性能不断地提升,也使整个开发效率得到比较大的提升。

  再一个是模型的不断地变迁。
  从18 年的 ResNet 到 22 年的 EfficientNet,到现在 Transformer ,它已经属于一个大模型了。参数量的增加,也意味着芯片算力需求的增加。

  所以,不管是开发范式算法的应用,还有大模型的应用,都对整个算力提出了更高的需求。这是地平线观察到的一个技术发展的趋势。

  下面介绍一下地平线在智能芯片和计算方案上的一些创新。
  2016 年,地平线首先提出关于智能计算的新摩尔定律。这个定律实际上把计算的能力、计算的效率、计算的效能几个概念,有机地结合在一起。
  那么,什么是计算能力呢?计算能力就是平时常说的TOPS,而真实计算效能是每一秒钟你能处理多少帧图像。效能是你每一块钱的硬件投入,或是每 1 瓦的功耗对应的效率是多少,这个才是真正真金白银的东西。
  它拆分成三个要素,分别是算法、芯片架构和编译器。怎么使计算的能力能够充分利用起来,以支撑左边算法的需要,最后才能得到最后的效能。根据这个去找到提升芯片性能的一个方向。

  下面我就从这几个方向,把地平线的创新工作,给大家做一个简单的介绍。

  今年在世界顶级计算机视觉会议CVPR会议上,地平线学者作为第一作者的论文拿到了最佳paper。这也是中国研究团队历史上第一次在这个国际顶尖计算机视觉大会上拿到 best paper。

  地平线提出了UniAD,Unified Autonomous Driving 这么一个大模型。这个模型首次将检测、跟踪、建图、轨迹预测、占据栅格预测及规划整合到一个基于 Transformer 的端到端网络框架下,按照感知预测决策流程来深度融合。
  它实现了整个自动驾驶算法和性能的全面提升。那跟此前神经网络比较,它更加安全,更可控,更可解释。通过端到端这个大模型、 Transformer 大模型和 BEV 的组合使用,能够对道路的要素进行更好的关联和解释。
  比如在左转时候,左转路线跟左转过去的几个车道之间的相互关系,会进行相应关联,使得整个规划过程中,对道路要素有更好的理解和关联,也对重感知轻地图提供了一个技术底座,来支持朝这个技术方向发展。

  介绍下地平线在智能芯片上的最新发展。今年 4 月上海车展,地平线发布了的最新一代这个 BPU 纳什架构,取得了很多核心技术的创新突破。主要都是跟存储计算和数据总线的带宽直接相关,来进一步提升整个 BPU 处理的效能和速度。

  关于纳什架构我简单分享几个突破性的核心技术。
  首先是我们第一次引入了浮点向量加速单元,可编程性的,对于算法支撑变得更好,可以使用户可以在更细的颗粒度上进行开发。
  第二是虚拟化,把一个物理的 BPU 和在应用过程中表现出多个虚拟化的核,使得多重的任务执行完全透明化。对于终端应用和开发者来而言,对于复杂场景的处理非常有效。

  第三是计算微架构,深入了解计算过程当中的数据分布特点,根据这些分布特点来设计一个计算的微架构,使得它在计算过程当中动态功耗降低 30% 以上。

  另外介绍下关于编译器的优化。编译器优化,实际上是把软件、硬件联系在一起的,一个非常重要的部分,使得整个芯片能够最大程度发挥优势。
  还有基于Graph的高效执行引擎和并行调度。编译器的深度优化和基于Graph的优化,最后实现了编译速度提升10X, 模型推理性能提升大于20%

  2021 年 7 月征程5首次发布时,处理帧数是 1283 帧/秒。在硬件完全不变的情况下,通过编译器的优化,一年以后去年 7 月份达到了 1531 帧/秒,整个性能提升20%。今年最新的结果,通过编译器进一步优化,每秒能够处理 1718 帧。

  我想强调的是,在硬件不变的情况下,只是对编译器优化,就可以很大程度提升这个芯片性能,提升可用的真实算力。
  为了提升自动驾驶性能和用户体验,地平线在提升产品开发效率、降低开发成本上,也做了进一步的工作,推出了智能驾驶应用开发套件,TogetheROS·AUTO。这是一个集开发、集成和验证三位一体的开发套件。

  TogetheROS·AUTO包含了支持量产的应用开发框架,还有开放验证工具、接口与协议,以及算法和功能节点,多模块协同开发,解决行业多供应商协同开发的困难,帮助合作伙伴提高效率、降低成本。另外地平线还推出了自己的云开发平台。通过这些,地平线已经打通了全产业链的生态合作。

  截至目前,地平线已经有 50 余款合作车型量产,征程芯片出货量已经达到 300 万片。目前,我们跟100多家合作伙伴,一起去支持 20 多家主机厂,定点车型达到120多款。

  地平线芯片量产零的突破,特别感谢长安。长安UNI-T是第一个吃螃蟹的,当时用的是征程2芯片。征程3、征程5的首发是理想汽车。新上市的比亚迪腾势N7 也是搭载了征程3。通过这些客户,地平线逐步得到了业界的认可,特别感谢主机厂的认可,特别感谢我们的合作伙伴,大家通过合作,不断地去支持更多的车型。
  在大家的共同努力下,我们看到自动驾驶正在不断地朝着好的方向演进。在此我们也期待进一步跟我们的合作伙伴一起,跟主机厂一起,来共同推动自动驾驶发展。
  我的汇报就到这里,谢谢大家。
  (注:本文根据现场速记整理,未经演讲嘉宾审阅)


报道 日程 顶部