> 自媒体 > (AI)人工智能 > EleutherAI 推出 200亿参数的类 GPT 模型:不像 GPT-3,它免费开放
EleutherAI 推出 200亿参数的类 GPT 模型:不像 GPT-3,它免费开放
来源:雷峰网
2023-06-03 22:58:16
953
管理

2

GPT-NeoX-20B 的优势:免费开放

简单来说,GPT-NeoX-20B 是一个包含 200 亿参数、预训练、通用、自回归大规模语言模型。

如果你不知道是什么,想想 OpenAI 的 GPT-3,它是近两年前震惊世界的大型语言模型,语言能力神通广大,包括编写计算机代码、创作诗歌、生成风格难以区分的带有权威语气的假新闻,甚至给它一个标题、一句话,它就可以生成一篇文章,因为它可以根据很少的输入信息自行「创作」,而且创作出来的东西还可以文意皆通。(题外话:就像漫威低配版的贾维斯)

必须承认的是,OpenAI 的模型比 EleutherAI 更大,有 1750 亿个参数(模型内部编码信息的节点或数字)。参数越多,模型吸收的信息就越多、越细化,因此模型就越「聪明」。

但 EleutherAI 是世界上同类模型中最大、性能最好的模型,可免费公开获得。

「我们希望更多的安全研究人员能够使用这项技术。」Leahy 说。

此外,EleutherAI 与 OpenAI 在训练大规模模型所需的计算能力上有所不同。

OpenAI 在数量不详的 Nvidia V100 Tensor Core GPU 上训练了 GPT-3。此后,OpenAI 的合作伙伴微软开发了一个用于大型模型训练的单一系统,该系统具有超过 285000 个 CPU 内核、10000 个 GPU,以及每个 GPU 服务器每秒 400 Gb 的网络连接。

这并没有阻止 EleutherAI 在反 GPT-3 垄断上的努力。他们最初使用谷歌提供的硬件作为其 TPU 研究云计划的一部分,构建了一个具有 60 亿个参数的大型语言模型 GPT-J。对于 GPT-NeoX-20B,该小组得到了 CoreWeave 的帮助,CoreWeave 是一家专门针对基于 GPU 的工作负载的云服务提供商。

虽然 OpenAI 号称是人工智能非盈利组织,但目前来看,其本质还是由科技公司主导开发的私有模型。

EleutherAI 的数学家和人工智能研究员 Stella Biderman 对 IEEE Spectrum 表示:

「这些私有模型限制了我们这种独立的科研人员权限,如果我们不了解它的工作原理,科学家、伦理学家、整个社会就无法就这项技术应该如何融入我们的生活进行必要的对话。」

EleutherAI 的工作促进了对大型语言模型的可解释性、安全性和伦理的研究,受到外界肯定。

机器学习安全领域的主要人物 Nicholas Carlini 在最近的一篇论文中表示:「如果没有 EleutherAI 完全公开发布 The Pile 数据集及其 GPT-Neo 系列模型,我们的研究是不可能实现的。」Pile 数据集是一个 825 GB 的英文文本语料库,用于训练大规模语言模型。

3

开放模型访问权限是 AI 发展的必要条件

马斯克不只一次发表人工智能比人类强这一观点。他认为人是碳基生物自带上限。而人类进化的速度很明显比不上人工智能,所以人工智能迟早超过人类,这是AI最大的潜在威胁。OpenAI 也是他基于这个考量和其他科技大亨共同创立的。

Leahy 认为 AI 的最大风险不是有人利用它作恶,而是构建一个非常强大的 AI 系统,无人知道如何控制。

他说:「我们必须将人工智能视为不像我们思考的奇怪外星人。」他补充说,「人工智能擅长优化目标,但如果给定一个愚蠢的目标,结果可能是不可预测的。他担心研究人员会在创造越来越强大的人工智能的竞赛中过度自信,在这个过程中偷工减料。」

其实任何志同道合的计算机科学家都可以构建一个大型语言模型,但很难获得合适的硬件来训练大型语言模型,因为这需要非常高的资本投资,而如今只有几百家公司拥有这种硬件。

「我们需要研究这些系统,以了解我们如何控制它们。」EleutherAI的创作初衷正是通过使这种规模的模型易于访问,从而让有兴趣的人们进一步研究人工智能系统的安全使用。

反观 OpenAI,「Open」怕不是只对金钱 Open 吧?

参考资料

1.https://spectrum.ieee.org/eleutherai-openai-not-open-enough

2.https://blog.eleuther.ai/announcing-20b/

3.https://github.com/EleutherAI/The-Pile

4.https://mystic.the-eye.eu/public/AI/models/GPT-NeoX-20B/

5.http://www.caotama.com/1180119.html

雷峰网

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
10万左右新车燃油版轿车,家用这五款最值得买
有粉丝说推荐一下10万左右的新车轿车,不选SUV,不选新能源电车混合动力..
年轻人买轿车不用买太贵,2026有“真香价”的3款轿车,高价低配..
买燃油轿车,不想买太贵的,大多人都想买低价高配的,而且低价位的车还是..
方程豹镁7谍照曝光!20-25万级掀背式运动轿车
【太平洋汽车 新车频道】日前,一组方程豹全新轿车镁7的测试车谍照在网络..
10万左右新车燃油版轿车,家用这五款最值得买
根据纯油车一月份的销量榜,又问了4S店的朋友,总结了5款热门轿车,今天..
颜值即正义!5款网红轿车:最高续航破千+仅20万起,谁最值得等?..
#丰田品质B级纯电家轿9.38万##长文创作激励计划#​兄弟们,最近比亚迪的..
安全性高的轿车推荐:速腾L与四款主流家轿安全配置实测对比..
近年来,A 级家用轿车市场愈发“内卷”:合资品牌持续下探,自主品牌向上..
预算不到10万家用轿车别乱选:这4款车,各自适合什么人一次说清..
很多人到了年底想换车,第一反应就是一句话:“预算不多,但想买个靠谱的..
家用轿车常青树再升级!2026款丰田卡罗拉实测:省油、可靠、好开..
动力是2026款卡罗拉的核心亮点,提供1.2T燃油、2.0L燃油、1.8L智能电混双..
手握 20 万预算买台新车回家过年,到底该怎么选?轿车篇..
临近春节,20 万预算的新能源轿车市场早已是神仙打架。既要撑得起返乡排..
关于作者
阳光下的微笑..(普通会员)
文章
2057
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112737

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索