当前位置 > 首页 > 新车频道 > 爱卡头条 > 解读DriveGPT:解谜的过程唯有躬身入局
[原创]

解读DriveGPT:解谜的过程唯有躬身入局

第 1/2 页:为什么DriveGPT也能称之为“GPT”?
第 1/2 页:为什么DriveGPT也能称之为“GPT”?第 2/2 页:DriveGPT跑到什么程度了?
浏览全文 (共计2页)

  [爱卡汽车 爱卡独角SHOW 原创]

  AI的每一次出手都超过了大众心理预期。

  2023年初,ChatGPT彻底火爆全球,引发大众狂欢,比尔盖茨的这一判断被一再验证。ChatGPT之所以能成为“很会聊天的AI”,是因为训练的时候使用了RLHF算法,利用人类知识,让模型能判断自己的答案质量,训练自己逐步给出更高质量的回答。顾名思义,名词雷同的DriveGPT,也能够通过不断学习千千万万个老司机的驾驶经验,进而帮助模型自己做出最优决策吗?都是GPT,DriveGPT和ChatGPT有什么区别?真正的DriveGPT何时能够到来?本期《爱卡独角SHOW》,我们就来聊一聊DriveGPT上车前的故事。

真正的DriveGPT何时能够到来?

  01、一家非常典型的“特斯拉”路线公司

  如果盘点中国自动驾驶行业,我们可以发现一家非常典型的“特斯拉”路线的自动驾驶公司——毫末智行。

  在目前的自动驾驶领域,行业里优秀的案例就是特斯拉的Autopilot和FSD。Autopilot软硬件系统的快速迭代,确保了特斯拉车型实现规模量产的同时,其车端AP系统的数据积累能够保持同样的高速增长。特斯拉不仅自研了FSD车端大算力芯片,而且实现了车端的预装,并通过软件售卖的模式来实现商业化。同时,特斯拉在近两年加快了超算中心的建设,对以Transformer大模型为代表的最新AI技术,在自动驾驶上的探索和应用不断深入。可以说,特斯拉的技术路线以及量产模式,已经成为全球自动驾驶行业的样板。

一家非常典型的“特斯拉”路线公司

  再来看毫末智行的路线。今年初,毫末智行有两个动作,一个是发布了自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),另一个是发布了自动驾驶版的ChatGPT,毫末称之为“DriveGPT”。DriveGPT实际上是毫末在自动驾驶认知大模型上的成果,其核心是基于真实人驾数据,特别是将人驾接管数据引入大模型当中,持续优化自动驾驶的认知决策模型。

一家非常典型的“特斯拉”路线公司

  经过多年的发展,自动驾驶经历了以硬件驱动为主的1.0时代、以软件驱动为主的2.0时代,目前正在进入由数据驱动的自动驾驶3.0时代。自动驾驶当前的技术范式与十几年前的自然语言处理技术非常相近,即小数据、小模型,通过采集各种各样的交通数据、进行人工标注、再用这些数据训练出小模型,然后再把模型部署到车上,结合业务规则,去控制车。这种模式的弊端十分明显——一旦量产上车,当数十万辆车在全国各地跑起来,就会出现各种各样的路况、场景,如果还按照之前的思路去做人工标注,一方面需要消耗大量的人力成本和时间,另一方面则永远不可能标注完所有场景,场景的变化几乎是无穷的。

一家非常典型的“特斯拉”路线公司

  过去几年,自然语言处理领域,大模型技术取得了技术突破,尤其是GPT这样的大模型出现以后,大模型具备很强的泛化能力,通过一个大模型就能解决各类问题。基于这样的行业困境、借鉴自然语言处理领域的经验,毫末相信大数据、大模型会成为自动驾驶领域一种新的解题思路。

一家非常典型的“特斯拉”路线公司

  在技术路线上,毫末早在2021年初就开始探索将Transformer大模型技术落地应用到自动驾驶产品当中,同时也成为国内首家研发落地BEV感知技术的自动驾驶公司;2022年4月,率先在国内发布以“重感知”方式实现的城市NOH导航辅助驾驶产品;2023年4月,基于GPT大模型所具有的生成式、预训练、人类反馈强化学习等技术优势,毫末将视觉自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型、人驾自监督认知大模型等五大模型进行统一升级,发布了行业首个自动驾驶生成式大模型DriveGPT雪湖·海若。至此,DriveGPT诞生。

一家非常典型的“特斯拉”路线公司

  02、为什么DriveGPT也能称之为“GPT”?

  GPT,是一个大规模的通用预训练大模型,而DriveGPT正是采用了与ChatGPT一样的具有Attention注意力机制的Transformer架构的大模型,其特点是随着模型参数规模、数据规模增加以及训练方法的提升,模型算法的效果也稳步提升,适应性更好。

为什么DriveGPT也能称之为“GPT”?

  因此,DriveGPT的底层模型与ChatGPT一样,都采用了生成式预训练模型架构,使用了大规模无监督的数据进行初始模型的生成,也都采用了Prompt微调方式和RLHF人类反馈强化学习的方式进行模型效果的优化;二者的不同之处在于,ChatGPT输入输出的是自然语言的文本,而DriveGPT输入输出的分别是历史场景序列和未来场景序列,ChatGPT主要用于自然语言处理领域,而DriveGPT主要用于自动驾驶领域。

上一页12下一页 >无广告读全文
微信
微博 QQ空间
 

最新文章

24年澳洲新车总销量出炉,3款皮卡杀入十强榜单
24年澳洲新车总销量出炉,3款皮卡杀入十强榜单

:2024年澳大利亚再次收获一个销量破纪录的丰收年。3款皮卡杀入车型榜前十名。2024年澳大利亚上市了多款新皮卡车型,皮卡市场竞争变得空前激烈。进入2025年以后,又将有多款重磅新皮卡将陆续交付,市场将变得更加富有挑战。

爱卡汽车作者:爱卡汽车 02025-01-18

降3.3万!吉利银河新L6预售8.98万起 续航超2000km
降3.3万!吉利银河新L6预售8.98万起 续航超2000km

吉利银河L6 EM-i预售先享提车价8.98万-11.68万,顶配比现款便宜3.3万元。新车换搭1.5L插电混动系统(现款为1.5T插混),油耗比现款更低,综合续航超2000km。

爱卡汽车作者:爱卡汽车 82025-01-17

龙颜焕新 比亚迪汉L唐L以中国元素定义未来汽车美学
龙颜焕新 比亚迪汉L唐L以中国元素定义未来汽车美学

比亚迪在“何以中国 盛世王朝”汉L唐L设计发布会上展示了汉L和唐L。以其独特的“LOONG FACE”设计理念,为中国汽车注入全新的文化灵魂。

刘鑫作者:刘鑫 22025-01-17

比亚迪销售:新海豹06到店!配置升级!还卖9.98万?
比亚迪销售:新海豹06到店!配置升级!还卖9.98万?

新款海豹06 DM-i到店,智驾和配置再升级,新增6颗超声波雷达、车头前端摄像头、尾部高位摄像头、外后视镜摄像头、侧翼子板摄像头、三目摄像头+行车记录仪、毫米波雷达和蓝色天神之眼尾标(纯视觉方案)。车内换装8.8英寸仪表盘(带5车道动态显示、全屏导航)、Dlink100 5.0车机、智驾拨片和电子转向拨杆等。

爱卡汽车作者:爱卡汽车 62025-01-17

冰雪驾控彰显强悍越野实力,中国重汽搏胜S9皮卡硬核越野配置解读
冰雪驾控彰显强悍越野实力,中国重汽搏胜S9皮卡硬核越野配置解读

在皮卡乘用化的大背景下,各家皮卡车商都开始发力角逐越野皮卡市场,更多用户也都开始将皮卡作为自己的出游伴侣和越野利器,相比SUV车型,皮卡在越野方面具备天生的结构优势,并且普遍性价比更高,另外货箱的存在也为其带来了多用途属性和更好的户外延展性。

爱卡汽车作者:爱卡汽车 62025-01-17

×爱卡官方微信
用微信扫描二维码添加爱卡汽车为好友
您可以在微信上找车型、看热帖、读资讯,还能参加各种好玩的活动。