睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

关于智能驾驶的七个核心观点

时间:2022-07-13来源:幼儿园扛把子浏览数:94

数据其实没有价值,有价值的是数据沉淀为案例场景,我们经历了很长一段路,最早是案例手动编辑,我们看到了现实生活中存在的场景不能处理的话,我通过案例的手动编辑完成,这是第一个阶段。第二阶段可以自动生成场景,比如先把路网做进来,可以加入随机的交通流,交通流里是随机车辆,最后形成open scenario案例的生成,用数据生成案例,生成案例每一个场景可以加入随机噪声,确保这种场景彻底做深做透不再出现问题。

2022年7月8日,第十四届中国汽车蓝皮书论坛继续在武汉经开区举行。驭势科技联合创始人、董事长兼CEO吴甘沙在第十四届中国汽车蓝皮书论坛上发表了主题为“剑指2025:乘用车智能驾驶淘汰赛的七个核心观点”的演讲。

“自动驾驶下一步该怎么走?我们是有一种焦虑的,尤其2025年可能是非常重要的时间节点,我们从战略层面,如何去面对这么一个淘汰赛?”开场时他提出了这样一个问题,这也正是自动驾驶目前面临的一种普遍困境。

来今天我这个演讲是我们内部做过的一个小小的讨论,大家知道驭势科技做乘用车也已经做了大概6年了,但是我们主要是软件的Tier2,所以参与了4款量产,也做了我们高速的NGP、停车的AVP、城市道路的像Robtaxi这样的场景。下一步该怎么走?我们是有一种焦虑的,尤其2025年可能是非常重要的时间节点,我们从战略层面,如何去面对这么一个淘汰赛?所以我们自己总结了七个核心观点,我们里面讨论的时候要讲一个多小时,今天高度浓缩一把跟大家做一个分享。今天上午博泰也对过去很多年蓝皮书论坛做了回顾,我参与了好多年,把以前的一些PPT拿出来做回顾。这是我2019年的观点,自动驾驶尤其是L4知易行难需要协同创新。因为L4 层面99分就等于0分,它还有所谓的991原则。我们虽然已经走过了99%,剩下的1%可能还需要99%的时间和努力。L4最终,我们是需要在大数据的意义下面证明比人安全,而这个大数据可能需要百亿英里的概念,这意味着我自己弄个几百台L4的车辆是无法到达这样的终局,所以我当时也给出了这么一个简单的算术,我们希望一定要有1千万台车装上这套系统才有可能到达终局。我们当时列举了和一些主机厂的合作项目,这是2019年我们有了一个初步的设想,一定要把车队的数量做大,2020年我们的标题叫智能驾驶的中场战争,我回顾特斯拉如何三步走,给出了一个结论说我们一定要找到一个满足影子模式的最低成本平台。我给出了一张图,这是当时的PPT,我认为在2021到2023年之间,可以出来这么一种产品,它是L2的身体、L3的体验、L4的灵魂,这么一个产品大家可以看到我把高速的行车,把停车场的泊车,以及城市道路的产品放在了一个体系当中,可以说在2020年我也预测了L2++和行泊一体的产品形态出现,这是2020年。到2021年我的标题叫从L2+到L2++的几点思考,这个时候我就更加明确地提出来了两种产品形态,一种产品形态叫做三场景合一,这是我们现在说的L2++的产品,大家看左下角。另一种产品形态刚才唐总讲了行泊一体,这两种形态都非常强调体系的共享能力,不同的传感器包括域控制器在不同场景间的共享,我认为L2++是OEM主导研发的,自动驾驶公司更像一个模块提供商。在行泊一体当中,可以是OEM主导,也可能是OEM和技术公司联合做到的产品,我们说产品形态1就是三场景合一,需要一种能力叫借假修真,虽然是L2++的产品,但是它修的是L4的能力,第二种产品形态一定要走量,走量我们用的词叫草船借箭,大量的车主是你的安全员,是你的训练师,他能够在这么一个大量的平台上帮助你获得数据和训练你的算法。在去年我也提到OEM和供应商的关系需要重构。第一,集成不再是一个供应商通过一个黑盒完成的过程,需要黑盒、白盒、灰盒。第二,交付不再是一次性的交付,在整个生命周期当中需要不断的数据迭代。第三,不再是一手交钱,一手交货物,什么是丰润的模式,可能是XaaS/Pay as you go,也可能是其他的模式。供应商需要三种模式:

1、你需要把你的产品拆解成模块,可量产、可白盒产品模块覆盖高速、停车场和城市三大场景。

2、驾驭复杂软硬件系统能力。

3、后端有全功能云脑,实现数据和AI算法闭环。这是我前面三年的回顾,今年希望在这些观点上做一些分享。前三年到达终局需要靠这个公式,第一数据量大,靠的是硬件成本低车队规模大;第二数据价值密度高,密度高第一传感器尽量全,覆盖的场景和区域尽量广;第三数据迭代能力强,车端要有足够算力,云端更需要算力,数据闭环要打通。在行业当中这两种产品,第一种L2/L2+是高性价比产品,硬件成本低量大,可惜很多没有数据闭环,数据价值密度低,传感器少、算力低、场景不全,好处是区域覆盖率高。另一种产品是很多人做的Robotaxi,硬件成本高,量小,有数据闭环,数据价值密度高,场景复杂、可惜区域覆盖率低,只能在某些城市的某些区域来做。现在整个行业在做的是在这两种产品上进一步迭代,左边往右走引入数据闭环形成行泊一体,右边往左走把L4技术降维到L2++,实现三场景合一。过程中不可避免涉及到数据,怎么把算法和车企、数据形成闭环,需要和OEM形成关系重构,需要在商业模式上有一种全新的分润模式,这种预测在行业当中已经有了很多的动作。在Robotaxi的玩家,不断的把成本降低,通过和Tier1合作进入到乘用车量产,传统的智能L2级别的玩家立足于行和泊,进一步再往城市场景当中去进发。另外是L2玩家往行泊一体方向走,很多科技公司发现数据闭环是很难实现的,跟OEM的关系怎么来重构,如果重构不好,是不是我自己就做OEM了,所以大家看到下面这些科技公司又有了新的动作。总体上来说,总结这三句话:第一,低成本L4降维到L2做大规模,第二,扩展产品价值做全场景,第三,重构与OEM关系形成数据闭环。特斯拉是覆盖了三大场景,高速叫NOA,停车场AVP做得并不多,这和美国的场景相关,他并不需要地下停车场的AVP,他做了智能召唤和APV,城市道路他叫FSD,他是用一套产品实现,可以说是L4降维型的产品,特别独特的是没有用激光雷达,中等的传感器,这保障了车队的数量是足够大的,车队数量大同时覆盖场景多,唯一的缺点是数据的价值密度比较低一些。大家可以看到特斯拉做了几个Hardware版本的迭代,迭代速度非常快,保证了绿色的部分,是最新办法的Hardware,硬件迭代过程中自动驾驶操作系统的延续性非常好。高配的系统贡献了绝大多数的里程。现在市场上是三种产品形态独立发展,最右边是L4降维到L2,我们叫L2++,特点是在中国使用到高端、低成本的激光雷达,问题是车数量比较少,好处是数据全。左边两个是更能上量的产品,最左边是普通的L2+,是NOA,数量特别大,绝大多数是没有数据闭环的,中间行泊一体是中等传感器和中等的算力,具备了数据闭环,算法有一定的迭代能力,车的数量逐步在增加,数据还是不够全,这是现在市场上三种产品形态独立在演进的过程。驭势科技的想法,我们也有三个产品,我们叫做高智价比的产品,智力除以价格,最左边和市场上最低成本的产品一两千块钱的产品是没有太大差别的,我们要强调在这个低成本的前提下,能不能实现有限的数据闭环,支持很好的算法迭代。右边这两个产品也强调高质价比,中间的产品是L2价格实现L2+的智力,右边是L2++入门价,能实现L4的智力。在市场普通产品的基础上,我们进一步加强了数据闭环,最重要的一点是右边两个产品通过一套全场景自动驾驶操作系统打通,好处是左边这两个能让更多车回送数据,右边能实现高质价比价格可以承受,加速这一类车型的渗透率,解决数据大和数据全的问题。今天的核心观点:

01智价比是未来竞争的关键

你要具备数据闭环能力,具备算法迭代能力,同时价格还不能太高。

02要降低价格重要的是降低研发成本

共享自动驾驶操作系统,同时兼顾大和全是很重要的工作。这是去年在工信部的人工智能产业创新揭榜挂帅上面,自动驾驶操作系统领域获得了优胜奖,在自动驾驶操作系统上,首先是模块化可组合,有些模块能实现功能安全,同时实现跨平台和轻量级。比如说纯视觉算法,现在流行BEV,我们要把它作为一个模块做出来,激光雷达我们也可以做模块,做全景的目标检测和分割,在这两个基础上还可以做融合,把视觉和激光雷达又融合实现全景,这样可拆可合,更容易满足L2++这种高阶段产品的要求。

03数据闭环和算法迭代速度是致胜核心

数据闭环我们也说了很多,算法迭代速度非常重要,我拿特斯拉做案例,他花了1.4亿美金做了超级计算器,目的是为了比别人快,数据其实并不多,100万个10秒的视频,他把他认为重要的内容都放进去了,超级计算机确保他能快速的做算法模型迭代,我们有一个段子每天提升1%,一年以后就是37倍的我,他通过快速的迭代来实现超越。在中国做数据闭环有很多挑战,第一个就是要合法合规,这是国家标准委和网信办分别出的两个标准,大家有兴趣可以看一下。未来针对智能汽车的地理信息采集存储、传输和管理,会进一步严格的要求,合法合规是第一步的。刚才说高智价比很便宜,存储和传输的成本怎么解决。拥有一般是车厂,有时候是车主拥有,监管一定要有监管体系,使用往往是算法公司在使用,这里面怎么来平衡?我们也是试图做一个最低成本的数据闭环,车端可以看到有事件触发器、数据脱敏器,可以降低清晰度,可以把高清的摄像头降到120万像素以下,还有匿名人脸和车牌的匿名,还有数据打包器,传输和存储成本高怎么来打包。到了云端以后,大家可以看到两条线,一条线是数据分拣,半自动标注、模型训练,另外一条线是形成测试用力,加入场景库,做仿真和路测case,路测要么就是通过hotfix的形式,要么就通过发版测试,可能一个季度就发一个新版,里面存在一个灰度发布和量子发布,灰度发布是选择一些车型率先发布,量子发布是把新版发到这辆车上,老版还是存在的,新版和老版同时存在,大家听说过薛定谔的猫可能是死的也可能是活的,它既可能是新的也可能是旧的,这形成了最低成本的数据闭环。数据其实没有价值,有价值的是数据沉淀为案例场景,我们经历了很长一段路,最早是案例手动编辑,我们看到了现实生活中存在的场景不能处理的话,我通过案例的手动编辑完成,这是第一个阶段。第二阶段可以自动生成场景,比如先把路网做进来,可以加入随机的交通流,交通流里是随机车辆,最后形成open scenario案例的生成,用数据生成案例,生成案例每一个场景可以加入随机噪声,确保这种场景彻底做深做透不再出现问题。

04需要和OEM构建可信互利的基础设施

一种如果和OEM深度结盟的话,可以打开数据和技术的白盒,还有一种情况和很多OEM合作,怎么实现数据闭环,一种方式是做私有化训练服务,我在OEM地方做驻场训练定期更新,还有一种在探索的是请OEM把数据上转,数据是带有OEM标签的。在中央训练平台提升模型,要记录不同OEM的数据贡献度,把不同OEM数据融合成新模型,让每一个OEM都能享受到,因为不同OEM数据贡献度不一样,应该有一种长期的分润模式,这种互信和互利的模型是未来技术提供商和OEM的全新关系。

05从L2到L3的飞跃需要商用车L4经验

无论是2.8、2.9、2.99,还不是L3,商用车L4的经验很有帮助,乘用车要上到L3像我扶着一个小孩教他走路,走路的环境是在悬崖边上,你一脱手就掉下去了,商用车的L4,我可以让它在简单的环境先脱手让他跑,逐步适应更复杂的环境。我们认为L2这个级别是好和不好的问题,L3是有和没有的问题,这就回到我们的标题,2025年淘汰赛一定需要L3,L3以上的产品没有3到5年的验证和运营经验是没有厂家敢于纵身一跃,通过商用车的场景来锻炼能力和经验是很好的,商用车的出错成本可控,因为先慢后快,先小后大,先载物后载人,先限定场景后开放道路,先远程监控再远程脱困。前不久旧金山Robotaxi公司出了一个事故,不是撞了人,是开不动把后面的消防车堵住了,消防车要急着救火,这种远程脱困的能力也很重要。我们积累了160万公里的真无人商业运营里程,每天人力运维事件不断下降,这是不断积累信心的过程。

06从L3到L4是考虑全天候运营能力

我们特别强调L4竞争壁垒是在于全天候业务的不中断,我在大雨当中是不是能跑,在大雪、大雾当中,L4和L2不同,L2如果天气不好可以退出自动驾驶系统,L4你是不能退出的,不能碰到恶劣天气的时候把司机请回来,这是不行的,这其实是有很多断裂。另一个是人祸,我们经历过网断云服务器断了,怎么快速恢复远程运维和无网运营,这对于未来从L3到L4非常有帮助的。

072025年L3大规模面世是淘汰赛的开始

今天特斯拉是一马当先,还没有一骑绝尘,它具备的数据和算法迭代速度的绝对优势,还没有帮助它越过临界点,很有可能未来几年会发生,我们一直在跟踪他的打开他的每过多少万公里出一次事故的数据。从2019到2020、2021有提升也有反复,Q1也是一样,其实是有反复的,2021年反而变糟了,2020年特别好,可能是因为新冠疫情导致路上的车少了,每年Q4都是特别糟糕的,可能是因为天气特别差,我们认为它不断的在提升,还没有把其他的玩家甩下。2025年是非常关键的时间点,我们还有3年的时间窗口,我期待我们跟行业的同行都能够像高尔基的这篇文章里写的《海燕》一样冲向乌云,而不是像海鸥和企鹅一样,去躺平或者躲避,2025年让我们一起去加油!
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询