> 自媒体 > (AI)人工智能 > 中信证券:GPT-4发布,持续逼近通用人工智能AGI,看好openAI及全球AI领域的产业投资机会
中信证券:GPT-4发布,持续逼近通用人工智能AGI,看好openAI及全球AI领域的产业投资机会
来源:金融界
2023-04-11 12:35:27
427
管理

近日openAI采用闭源模式发布多模态大语言模型GPT-4 ,该模型采用和GPT-3.5/ChatGPT相同的技术路线,但带来了更好的创造性、协作性、推理能力、安全性等,同时训练过程中采用定制超级计算机进行算力承载,并完善了大语言模型scaling law基础理论,实现训练资源可控。我们判断,GPT-4的良好效果,有望推动全球AI领域技术栈持续向LLM(大语言模型)模型收敛,并通过暴力美学 工程技巧的结合不断加速AI产业发展,带来更多应用场景落地的同时,亦帮助人类不断逼近通用人工智能AGI。我们持续看好openAI及全球AI领域的产业投资机会,并建议持续聚焦芯片、算力设施、模型架构&工程实践、应用场景等核心环节。

▍报告缘起:OpenAI正式发布GPT-4。

北京时间2023年3月14日晚,OpenAI发布了正式版本的GPT-4,取代了此前ChatGPT使用的GPT-3.5版本,并开始为付费的Plus用户提供服务。OpenAI在官网表示,GPT-4虽然在大多数现实场景中的能力不如人类,但在一些专业问题和学术基准上表现已经和人类持平。本篇报告将基于对GPT-4底层技术逻辑、实现功能详细分析的基础上,探讨GPT-4对全球AI产业带来的可能技术路径影响,以及产业层面的变化和机遇。

▍GPT-4:完全闭源模式发布,耗时6个月迭代调整完成的多模态大语言模型。

本次OpenAI推出GPT-4的形式与以往模型的发布都有所不同,OpenAI既没有公开发布GPT-4的相关论文,也没有提供详细的框架说明,仅仅提供了一份98页的技术文档。通过这一方式,OpenAI阻断了所有借鉴者参考的直接途径(模型大小、数据集构建、训练方法等),将闭源的路线坚持到底,这也符合我们之前对行业未来发展的判断:领先的头部公司(OpenAI、Google)将坚持闭源路线,避免其他公司复现其模型;落后一到两个身位的公司(Meta、Amazon、NVIDIA等)可能会选择开源路线,寄希望通过社区的力量加速迭代。

根据OpenAI发布的这份技术报告,GPT-4的训练以及迭代的耗时长达6个月以上,是之前发布的ChatGPT的两倍以上,在技术路径上沿用了自回归的Transformer模型加上人类反馈强化学习。模型能力方面最大的提升在于引入了多模态的处理能力,除了此前ChatGPT就支持的文字外,GPT-4还可以接受图片输入,不过暂时还没有开放给用户使用。此外,模型在面对复杂任务的可靠性与输出的安全性上均有显著的提升。

▍模型训练关键点:采用定制化超级计算机,完善了大语言模型scaling law基础理论。

尽管OpenAI没有公布模型的及具体训练细节,但从其在技术文档中的表述出发,我们找到了两点可能会影响整体产业的关键点:

1)OpenAI在去年开始就与微软合作重新构建一台用于大语言模型训练的超级计算机,而本次GPT-4的训练以及迭代环节应该是完全通过这台计算机所完成的。根据Bloomberg的相关报道,OpenAI与微软所搭建的这台计算机总共耗资数亿美元,使用了近万张英伟达A100显卡,这也与我们之前报告中对训练大语言模型所需要的显卡体量计算相一致。从OpenAI在技术文档中描述的结果看(训练 迭代总共耗时6个月),GPT-4的训练过程远短于此前的预期(从之前的论文出发,如此体量的模型迭代部分的对其就要耗费数月时间),这也表明了构建专用超级计算机的必要性。我们认为,在未来数月时间我们将会看到更多AI大厂效仿OpenAI的做法,将定制化的超级计算机提上日程。

2)Scaling Law是OpenAI团队在2020年发表的论文,主要对模型能力与模型大小、训练时长间的关系做了推算,也成为了大语言模型研究的重要理论。而在本次OpenAI的技术报告中,我们看到对scaling law有了进一步的完善。OpenAI表示在开发GPT-4的过程中进一步完善了Scaling Law,对此前无法解释的涌现能力(当模型体积大小突破到某一阶段时会突然出现某种新能力)可以更好的预测。Scaling Law的完善也意味着在模型训练资源的投入将会更加可控,AI厂商将不再需要为了涌现能力一味扩大参数,这将进一步降低AI训练阶段的成本。

▍应用场景:多模态能力加速多领域创新。

GPT-4相较于ChatGPT最直观的改变在于加入了支持图片输入的多模态的能力。尽管OpenAI表示目前多模态能力的重点还在于图片转文字,对于音频、视频、图片编辑等还不支持,但这也给了市场足够的想象空间。

1) 搜索领域:结合图片输入的多模态将更好的为目前传统搜索引擎 大语言模型辅助的模式进行服务。

2)智能客服:图片与文字结合输入的模式更加贴合目前ToC智能客服所遇到的一些痛点。

3)中小模型公司微调模型应用到具体细分领域:GPT-4被描述为一个通用的大语言模型,从OpenAI的文档看他们也没有兴趣对具体细分领域进行微调以求更好效果,那么这个在未来就自然会交到中小人工智能厂商手中:在GPT-4的基础上针对细分行业进行微调来获得更好效果。

▍风险因素:

AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;全球云计算市场发展不及预期风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。

▍投资策略:

GPT-4 采用与 GPT-3.5/ChatGPT 相同的技术路线,但带来了更好的创造性、协作性、推理能力,以及多模态能力等。GPT-4的良好效果,有望推动AI领域技术栈持续向LLM模型收敛,并通过暴力美学 工程技巧的结合不断加速AI产业发展,帮助人类不断逼近通用人工智能AGI。我们持续看好openAI及AI领域的产业投资机会,并建议持续聚焦芯片、算力设施、模型架构&工程实践、应用场景等核心环节。

本文源自券商研报精选

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
《飞驰人生》片尾为何谢王思聪?不止借车库,千万跑车全是真家伙..
提起《飞驰人生》,不少人都记得片尾字幕里王思聪的名字,却鲜少有人知道..
中国古代的顶级“超跑”,如今全球仅剩六千匹!汗血宝马是啥样?..
在历史的长河中,骏马总是与英雄、战争和传奇紧密相连,而对于我们中国人..
法拉利296 Challenge Stradale路试曝光:赛道版公路跑车即将到来..
【网通社快报】法拉利被拍到正在测试一款重度伪装的原型车,外观酷似赛道..
10款你应该现在就入手的跑车,趁它们还没成为经典款!..
整备质量马力扭矩布局2195磅138马力126磅英尺中置引擎,后轮驱动MR-S 是..
消息称保时捷下月推911 GT3 Cabriolet敞篷跑车:折叠软顶..
IT之家 2 月 24 日消息,汽车媒体 thesupercarblog 于 2 月 22 日发布博..
新能源汽车出海2.0:从“卖车”到“建生态”
文 | 惊蛰研究所,作者|芒种2007年,华语女子团体S.H.E的一首《中国话》..
汽车能“乘火车”返乡了!订单火爆→
今年春运,“12306托运汽车订单火爆”的话题冲上热搜。汽车“坐”着火车..
湖北造飞行汽车来了!单价或50万元以内,市民可以像开汽车一样开“飞车”..
极目新闻记者 黄忠 陈倩 杨绍杭 王俐燃 刘中灿像车,又像飞机,能垂直起..
紧急召回!近30万辆汽车,吉林车主快自查!
国家市场监督管理总局网站2月9日发布上海蔚来汽车有限公司的汽车召回信息..
关于作者
月深沉(普通会员)
文章
1913
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103523

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索