> 自媒体 > (AI)人工智能 > Meta连夜加入AI大模型混战!用1/10参数量干过GPT-3,单个GPU就能跑
Meta连夜加入AI大模型混战!用1/10参数量干过GPT-3,单个GPU就能跑
来源:智东西
2023-04-28 17:26:23
829
管理

5、代码生成(Code generation)

基于编程代码开源数据集HumanEval和小型数据集MBPP,被评估的模型将会收到几个句子中的程序描述以及输入输出实例,然后生成一个符合描述并能够完成测试的Python程序。

对于拥有相似参数的模型,LLaMA优于其他通用模型。

6、大规模多任务语言理解(Massive Multitask LanguageUnderstanding)

这一数据集基准涵盖人文科学、STEM、社会科学等各种知识领域的多项选择题。

经比较,研究人员发现,拥有650亿参数的LLaMA在大多数领域平均落后于拥有700亿参数的Chinchilla和拥有5400亿参数的PaLM几个百分点。

研究人员猜测,其中一个可能的原因是,他们在训练前使用的数据集较为有限,包括177GB大小的ArXiv、Gutenberg和Books3,而其余模型的训练数据足有2TB大小。

7、训练期间的能力进化(Evolution of performance during training)

在训练过程中,研发人员跟踪了LLaMA在一些问题回答和常识性基准上的表现,其都保持稳步提高。

不过针对于相关数据集的评估,研究人员认为其存在许多性能差异,该基准的结果并不可靠。

三、去年曾发布Galactica大模型,但因偏见和造假火速下架

关于大模型的研究如今在AI领域十分火热。其基本原理就是通过获取新闻、社交媒体或其他互联网资源上的文本,来训练软件,使得基于大模型生成的产品可以在用户给出提示或查询搜索时自行预测和生成内容,其目前最直观的例子就是最近爆火的聊天机器人ChatGPT。

也正由于这一现象级消费级应用的推动,使得科技巨头开始构建基于大模型的产品测试,并将生成式AI视作新竞争领域。

年初,微软向聊天机器人ChatGPT的创造者OpenAI投资了数十亿美元,随后,微软推出了其ChatGPT版新Bing搜索引擎。谷歌很快也加入竞赛,该公司基于其大型语言LaMDA推出类似的对话式AI应用程序Bard。

去年5月,Meta也曾发布了拥有1750亿参数的OPT大型语言模型,这一模型的适用对象也是开发人员,是生成其聊天机器人BlenderBot的基础模型。半年后,Meta推出名为Galactica的语言模型,该模型可以撰写科学文章并解决数学问题,但在推出三天后,这一模型就因经常胡言乱语以及给出虚假信息被撤下。

国外投资机构DA Davidson高级软件分析师Gil Luria认为:“Meta今天的公告似乎是测试他们生成式AI能力的一步,这样他们就可以在未来将它们应用到产品中。”

他还补充道:“生成式AI作为AI的一种新应用,Meta对此经验较少,但显然对其未来的业务很重要。”

结语:生成式AI竞赛不断升温

大型语言模型已经在生成创意文本、解决数学问题、预测蛋白质结构、回答阅读理解问题等方面展示出了巨大的潜力,如今ChatGPT的发布使得其在消费级应用市场中爆发。

继微软、谷歌之后,Meta也试图在这一领域展现自己的技术优势。

在科技大厂纷纷亮出生成式AI商用计划之时,Meta难得地聚焦在研究贡献上,无论是用更多数据训练出的更少参数规模模型实现优于更大参数规模模型的研究成果,还是将LLaMA模型和权重开源开放,都令人感到耳目一新。

但也由于仅限于研究用途,这可能导致Meta短期内难以在生成式AI领域形成像OpenAI、谷歌那样的影响力。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
GPT-5.5来了:3小时深度测试,告诉你和Claude Opus4.7到底差在哪..
4 月 23 日,OpenAI 正式发布了代号为「Spud」的 GPT - 5.5。彼时,我所..
GPT-5.2 来了,究竟是GPT-5.2好还是Gemini-3 强呢?
GPT-5.2的发布标志着AI领域新一轮的竞赛拉开帷幕。OpenAI这次直接甩出Ins..
GPT-3训练耗电抵120户年用电,普通家庭会被抢电吗?
普通家庭不会被AI“抢电”,因为AI的电力消耗有专门的规划和来源。GPT-3..
520万美元,训练出GPT-4级的AI?DeepSeek V4这次真的炸场了..
国产算力首次撑起万亿参数大模型,AI信创拐点真的来了朋友们,昨天DeepSe..
全球首个全民免费用ChatGPT Plus的国家,OpenAI官宣了
来源:市场资讯(来源:新智元)新智元报道编辑:艾伦【新智元导读】Open..
ChatGPT官宣理财功能 美国用户集体抵制 问题出在哪
ChatGPT向美国Pro用户推送AI理财功能,可直接连接用户金融账户生成财务仪..
手机端ChatGPT解锁Codex,能实时远程控制Mac端AI任务
IT之家 5 月 15 日消息,OpenAI 今天(5 月 15 日)发布公告,宣布 Codex..
ChatGPT网页端流量份额一年内从77.6%跌至53.7%,Gemini快速追赶..
IT之家 5 月 14 日消息,Similarweb 发布了主流 AI 聊天机器人最新的网站..
2026 ChatGPT 国内能用吗?使用方法完整指南,别再被割韭菜了!..
“2026年了,ChatGPT在国内到底还能不能用?”这个问题我每天都要被问好..
关于作者
泡沫人生(普通会员)
文章
1988
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110221

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索