> 自媒体 > (AI)人工智能 > 爆火的ChatGPT,能让自动驾驶更快实现吗?| 钛媒体深度
爆火的ChatGPT,能让自动驾驶更快实现吗?| 钛媒体深度
来源:钛媒体APP
2023-06-04 09:05:36
670
管理

最近,科技圈最火的话题莫过于“ChatGPT”。不过,ChatGPT只是一种外在表现形式,更值得关注的是背后AI技术进展以及未来的应用落地。

甚至有人乐观地描述ChatGPT所带来的变化:如果说ChatGPT之前,AI最多只是现有场景产品的一个模块。那么,ChatGPT之后,AI会重新定义现有场景的产品框架。

是否真如乐观者所言仍有待观察,但自动驾驶作为AI落地的重要场景之一,是否会在这波浪潮中有更进一步的发展,仍引起了不少人的探讨。

有人认为,自动驾驶需要更多的是图形、图像、数据的处理能力,对图像算法的要求更高,与自然语言处理的能力相关性不大,想要ChatGPT的能力来实现自动驾驶,目前还不太可能。

当然也有人认为,ChatGPT的出现给大家看到了一种可能,那就是经过训练后的AI,将会使得高级别的自动驾驶有望在几年后出现。

自动驾驶是AI落地的重要场景之一

为什么AI技术的进展会让人关注自动驾驶是否受到影响呢?

观察自动驾驶的发展历史不难发现,自动驾驶的每一次重大突破都跟AI技术发展同步。

我们知道,AI其实就是在模仿大脑神经元网络,通过分析大量的数据来学习一些非常人性化的技能。上世纪80年代,神经网络的第一次实际应用就是发生在自动驾驶领域。

1987年,卡内基-梅隆人工智能实验室的研究人员试图制造一种可以自动驾驶的卡车。他们通过为所有的驾驶行为人工编写代码,为卡车在道路上遇到的各种情况编写尽可能详细的指令,以此让车辆自动行驶。但遗憾的是,这种方式最终只能让汽车实现每秒几英寸的速度。

人工写代码的方式不成,另外一个叫迪安·波默洛的博士生选择了另一种方式:神经网络。

他给自己的系统命名为ALVINN,采用这个系统后,卡车利用车顶摄像头拍摄的图像来跟踪司机们在做什么,以此观察如何在道路上行进来学习驾驶。1991年,ALVINN以接近60英里的时速从匹兹堡开到了宾夕法尼亚的伊利市。

不过,更直接、更广泛的影响发生在2012年。

多伦多大学教授杰夫·辛顿和他的两名学生——亚力克斯·克里哲夫斯基和伊利亚·萨特斯基弗在ImageNet图像识别比赛上拿了冠军,并且发表论文介绍了算法AlexNet。这篇论文不仅是人工智能的转折点也是全球科技行业的转折点。

目标检测及图像识别作为自动驾驶的关键技术,高度受益于计算机视觉算法的突破,因此随着2015年斯坦福人工智能实验室主任李飞飞团队在ImageNet开放数据集上的识别准确率首次超过人类,自动驾驶作为AI最重要的落地场景之一,也进入了发展快车道。

对辅助驾驶的影响更直接,但上“车”成本要解决

那么,这次ChatGPT的出现会再次成为自动驾驶的Milestone吗?

一般来说,AI可以概括分为语音、视觉、自然语言理解三部分。上一波AI浪潮主要是基于视觉上图像识别技术的突破,而这次ChatGPT则是基于GPT-3模型的自然语言处理技术,它可以有效地模拟人类语言理解能力,从而帮助人们更好地理解和分析自然语言文本数据。

当我们要探讨ChatGPT会对自动驾驶产生哪些影响的时候,我们认为,首先要弄明白这里的自动驾驶指的是可量产的低级别的自动驾驶(辅助驾驶)还是高级别L4级别的自动驾驶?其次ChatGPT指的是一个语言模型还是更广义的生成模型?

如果从自然语言理解的角度出发,ChatGPT对于辅助驾驶部分的人机交互的影响更为直接,而对L4级别自动驾驶的影响或许并不大。

乘联会秘书长崔东树也在其微信公众号发文称,目前的人机交互和智能座舱体系的创新很强,尤其是国内车企的人机交互能力很强。汉语只有中国企业理解的更深刻。随着未来的底层赋能,国内汽车业界在应用层面将会有更多良好的人机交互效果。

比如通过使用ChatGPT,车辆可以通过语音或文本的方式与驾驶员进行交互,并向驾驶员提供有关车辆状态、行驶信息等的实时反馈。

在此之前,虽然已经出现了大量的车载交互系统,但是行业的痛点主要聚焦于“理解”部分,大部分的车载语音交互系统在“理解”上并不智能,导致整个系统功能单一、命令词单一。ChatGPT的爆火让市场看到了解决的希望。

不过,乘联会秘书长崔东树也同时表示,电动化是新能源车的核心,智能化只是锦上添花,未来车企的核心竞争力仍然是造好电动车,同时充分利用ChatGPT等智能化赋能汽车行业发展。

当然,不管是不是核心,想要ChatGPT上车,光有技术突破还不行,一位AI行业人士对钛媒体表示,“还需要面临成本的问题,包括使用成本、云服务成本、针对性的训练成本等。”

大模型或成趋势

但是,如果从更广义的生成模型来看,大数据、大参数的生成式模型会有助于实现更高等级的自动驾驶。

毫末智行数据智能科学家贺翔在接受钛媒体App采访时表示,车端能力主要包括两类:感知和认知,感知能力确实主要依靠图像技术,而认知能力则更依赖ChatGPT类似的生成技术。

也就是说,ChatGPT的重要革命性意义在于:让AI模型进入了知识和推理的时代。当前,自动驾驶最大的短板恰恰在于决策规划缺乏足够的智能。

ChatGPT 使用了一种叫“人类反馈强化学习(RLHF)”的训练方法,毫末智行数据智能科学家贺翔对钛媒体APP解释称,GPT是一个大规模通用预训练语言模型,GPT1、2、3主要是参数规模的提升,ChatGPT主要是引入了人类反馈数据做强化学习。

这种方法的引入可以在训练中根据人类反馈,保证对无益、失真或偏见信息的最小化输出。

恰好自动驾驶决策算法中也有一类叫做模仿学习,就是让机器去学习不同场景下人类驾驶员是怎样做的。

一般来说,人类司机的每一次接管,都是对自动驾驶策略的一次人为反馈;这个接管数据可以被简单当成一个负样本来使用,就是自动驾驶决策被纠正的一次记录。同时也可以被当作改进认知决策的正样本来学习。

“大数据、大参数的大模型能学到更多的潜在知识,包括不同的环境、不同的场景等,相当于学习到了大量的自动驾驶常识,这种常识对自动驾驶决策至关重要。”毫末智行数据智能科学家贺翔对钛媒体App表示。

也就是说,在自动驾驶研发的过程中采用人类反馈强化学习的思想,可以训练出模型来验证、评价机器模型的输出,使其不断进步,最终达到人类的驾驶水平。

所以,可以说基础能力的提升,带来了想象力及可应用场景的扩张。但目前阶段,我们仍然无法准确判断以ChatGPT为代表的大模型会给自动驾驶带来多大的变革,一位行业人士对钛媒体App表示,通过大模型训练而来的优秀泛化能力,可能让世间再无corner case。

corner case是指在自动驾驶中是指行驶过程中可能出现,但发生频率极低的小概率事件。尽管平时很少会遇到,但对于自动驾驶系统来说,遇到无法做出决策的corner case时,很可能会导致致命的交通事故。

ChatGPT的横空出世则让行业认识到,不断去累积公里数,一直这么跑下去是可以获得更高级别的自动驾驶技术的跨越。

事实上在此之前,不管是国外的特斯拉,还是国内的小鹏、百度、毫末智行都已经在探索“大模型”的路线了。

特斯拉在2020年宣布将基于深度神经网络的大模型引入其自动驾驶之中,到现在已实现了纯视觉FSD Beta的大规模公测;小鹏在2022年1024科技日中表达了使用大模型打通XNGP全场景能力的观点;百度Apollo认为文心大模型将是提升器自动驾驶能力的核心驱动力。

毫末智行则早在2021年宣布要借助大模型提升数据处理能力,今年2月17日,毫末智行将人驾自监督认知大模型正式升级为“DriveGPT”,将持续引入大规模真实接管数据,通过人驾数据反馈的强化学习,来不断提升测评效果,同时也将DriveGPT作为云端测评模型,用来评估车端小模型的驾驶效果。

不过,高级别的自动驾驶汽车的开发是一个复杂的多学科领域,涉及广泛的技术和监管挑战,人工智能技术进展可以带来一定的推动作用,但是这并非一个短期可以实现的问题。

有报道称,GPT3.0涉及了1700亿参数,内存达300多GB,训练过程耗费1200多万美金。上述行业人士表示,自动驾驶算法是要跑在车上,这么大的模型能不能部署到车端?又需要耗费多少算力支持?另外,自动驾驶不能依靠重复性、简单的路况数据堆叠就能完成,因此如何保证数据量大且有效也是一个关键的问题。(本文首发钛媒体App, 作者|韩敬娴,编辑|张敏)

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
如何再做一款社交产品
来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产..
2026金融AI实战手册:ChatGPT在投研风控与客户服务中的落地方法..
最近为了对比多个AI模型在金融业务场景的实际表现,找到了库拉KULAAI(c...
Wechat-cli 完整教程:聊天记录AI总结、统计、导出,数据绝不外传..
微信消息越堆越多,重要内容被淹没、翻聊天记录耗时费力、群聊99 根本看..
探索 OpenAI 聊天完成 API 的应用与使用
你想知道如何利用 OpenAI 的强大聊天机器人 ChatGPT 吗?在几秒钟内,这..
微信聊天反复出现“对方正在输入……”,说明对方在干什么?..
在微信里,最让人心跳加速的6个字,不是“我好喜欢你啊”,也不是“你的..
基于开源MobileIMSDK框架,即时通讯IM产品RainbowChat v12.0发布..
1、关于RainbowChatRainbowChat是一套基于开源IM即时通讯聊天框架 Mobile..
主流AI IDE的token成本爆炸?试试登上GitHub日榜的Claude Context..
总结来说,纯grep方案主要有三大问题:信息过载:现代代码库动辄数万文件..
郑州GEO优化:珍岛集团如何助力企业抢占AI搜索先机
随着生成式AI技术的快速发展,企业营销正在经历一场深刻变革。截止2025年..
甚好AI助手V1.0产品发布——企业 ERP 的全场景智能交互助手..
#甚好AI助手V1.0正式版于2026年4月正式发布#作为企业 ERP 全场景智能交互..
关于作者
月深沉(普通会员)
文章
1959
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105922

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索