> 自媒体 > (AI)人工智能 > ChatGPT技术探索6:ChatGPT历史产品GPT-3
ChatGPT技术探索6:ChatGPT历史产品GPT-3
来源:杨老师说专业
2023-08-16 15:55:41
600
管理

探索ChatGPT历史产品的目的和意义在于更好的了解GPT模型的构建与发展,回顾过去,才能更好把握未来。

GPT-3使用了一个名为Common Crawl的数据集作为其主要的训练数据源。这个公开数据集包含数十亿网页文本内容,覆盖了英语,法语等多种语言,并收集了互联网上各个领域的文本资源,如维基百科、新闻、社交媒体、书籍等。这些数据涵盖了广泛而丰富的知识和话题,为GPT-3提供了强大而多样化的学习资料。由于训练数据来源多样且数量庞大,GPT-3在各种语言和领域任务上表现出色。GPT-3的训练数据总共包含45TB的文本信息,相当于5000亿个单词。相比之下,GPT-2所使用的WebText数据集只包含了约40GB的文本信息,大致相当于前者的1/1000规模。因此,在数据规模和质量上GPT-3显然具有更大的优势。

GPT-3大体上沿用了GPT-2的结构,但是在网络容量上做了很大的提升,也做了一定的结构优化。GPT-3相对于GPT-2有如下改进。

1、GPT-3采用了96层的多头Transformer,每层有96个注意力头。

2、GPT-3的词语向量维度教育扩展至12888。

3、上下文窗口大小提升至2048个词。

4、使用了交替密集和局部带状稀疏注意力机制。

这些规模上的改进使得GPT-3的参数量达到了1750亿个,成为当时最大的神经网络模型。这一数字比GPT-2的15亿个参数增长了116倍。单说数值可能读者难以直观地理解,我们可以参考生物学的研究成果来理解它。一般来说。大脑中的神经元数量与生物的智能程度成正比。同样地,模型的参数量与其性能也有正相关的关系。GPT-2的参数量与蜜蜂大脑中的神经元数量大致在同一个量级。而GPT-3的参数量则与豪猪大脑中的神经元数量基本相当。可以形象地说,GPT-3相对于GPT-2的“智力”提升,犹如从昆虫进化到哺乳动物的巨大跨越。

交替使用密集和稀疏注意力的好处是提高计算效率的同时,能够平衡全局和局部信息的融合。全局密集注意力可以捕捉长距离依赖关系,而局部带状稀疏注意力可以利用序列中存在的结构化信息(如语法、句子边界等)。通过交替使用两种类型的注意力,GPT-3可以处理更长(最多2048个Token)、更复杂(如长文本的理解、生成等)的任务。

GPT-3和GPT-2一样,采用了无监督自回归的学习方法,即通过前面的文本预测下一个词或符号。这种方法使得语言模型能够生成连贯、流畅且符合语法、常识和逻辑的文本。与GPT-2不同的是,由于其巨大的数据规模、模型规模,以及优化技术等因素,GPT-3展现出了以下新的能力:

1、提示学习是一种利用语言模型中蕴含的知识来完成下游任务的方法,它通过设计合适的提示词(Prompt)来激活语言模型对特定任务的理解和表达能力。

2、情景学习也是一种提示学习方法。其特点在于,需要向语言模型展示一系列输入输出对,以展示给模型该任务的具体需求。

3、思维链是一种提高语言模型能力,使其能够进行复杂推理的方法。它通过让语言模型生成一系列中间推理步骤,来解决相对困难的问题。以算术运算为例,若希望GPT-3能够完成一个多步的四则运算任务,可以分步向其提供提示词。

综上所述,GPT-3相比GPT-2在数据量、模型规模和学习方法上都有了显著的改进,使得它能够处理更复杂、更多样、更具挑战性的自然语言任务。

今天就聊到这里,我想强调一下,我真的不是ChatGPT技术领域的专家,只是因为兴趣,我先一步使用了ChatGPT。所以我希望与各位同仁在讨论区一起探索和学习,共同进步,谢谢。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
《飞驰人生》片尾为何谢王思聪?不止借车库,千万跑车全是真家伙..
提起《飞驰人生》,不少人都记得片尾字幕里王思聪的名字,却鲜少有人知道..
中国古代的顶级“超跑”,如今全球仅剩六千匹!汗血宝马是啥样?..
在历史的长河中,骏马总是与英雄、战争和传奇紧密相连,而对于我们中国人..
法拉利296 Challenge Stradale路试曝光:赛道版公路跑车即将到来..
【网通社快报】法拉利被拍到正在测试一款重度伪装的原型车,外观酷似赛道..
10款你应该现在就入手的跑车,趁它们还没成为经典款!..
整备质量马力扭矩布局2195磅138马力126磅英尺中置引擎,后轮驱动MR-S 是..
消息称保时捷下月推911 GT3 Cabriolet敞篷跑车:折叠软顶..
IT之家 2 月 24 日消息,汽车媒体 thesupercarblog 于 2 月 22 日发布博..
新能源汽车出海2.0:从“卖车”到“建生态”
文 | 惊蛰研究所,作者|芒种2007年,华语女子团体S.H.E的一首《中国话》..
汽车能“乘火车”返乡了!订单火爆→
今年春运,“12306托运汽车订单火爆”的话题冲上热搜。汽车“坐”着火车..
湖北造飞行汽车来了!单价或50万元以内,市民可以像开汽车一样开“飞车”..
极目新闻记者 黄忠 陈倩 杨绍杭 王俐燃 刘中灿像车,又像飞机,能垂直起..
紧急召回!近30万辆汽车,吉林车主快自查!
国家市场监督管理总局网站2月9日发布上海蔚来汽车有限公司的汽车召回信息..
关于作者
轻随风之舞..(普通会员)
文章
1928
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103523

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索