> 自媒体 > (AI)人工智能 > Llama 3.1横空出世!开源巨无霸首次击溃闭源,全民GPT-4时代来临
Llama 3.1横空出世!开源巨无霸首次击溃闭源,全民GPT-4时代来临
来源:新智元
2026-05-16 12:33:13
33
管理

编辑:编辑部

【新智元导读】大模型格局,再次一夜变天。Llama 3.1 405B重磅登场,在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet。史上首次,开源模型击败当今最强闭源模型。小扎大胆豪言:开源AI必将胜出,就如Linux最终取得了胜利。

开源新王Llama 3.1 405B,昨夜正式上线!

在多项基准测试中,GPT-4o和Claude 3.5 Sonnet都被超越。也即是说,闭源SOTA模型,已经在被开源模型赶上。

Meta这次可谓是将开源的精神贯彻到底,同时大方放出的,还有一篇90多页的论文。

HuggingFace首席科学家Thomas Wolf赞赏道:如果想从0开始研究大模型,你需要的就是这篇paper!

它简直无所不包——预训练数据、过滤、退火、合成数据、缩放定律、基础设施、并行处理、训练方法、训练后适应、工具使用、基准测试、推理策略、量化、视觉、语音和视频……

AI2的研究员Nathan Lambert估计,这份90页的Llama 3.1论文,将直接把开源模型的进展往前推上3-9个月!

网友:一个新时代开始

Llama 3.1正式解禁后,在全网掀起轩然大波。

AI大神Karpathy随即发表了一些自己的感想:

今天,随着405B模型的发布,GPT-4/Claude 3.5 Sonnet级别的前沿大模型首次对所有人开放供大家使用和构建。。其权重开源,商用许可、允许生成合成数据、蒸馏和微调模型。

这是Meta发布的一个真正开放的前沿LLM。除此以外,他们还放出了长达92页的技术报告,其中包含有大量模型细节:https://ai.meta.com/research/publications/the-llama-3-herd-of-models/

主要能力

首先,Llama 3.1可以作为一个能够执行「智能体」任务的系统来运行:

- 分解任务并进行多步骤推理

- 使用工具

- 内置工具:模型自带对搜索或代码解释器等工具的知识

- 零样本学习:模型可以通过以前未见过的上下文工具定义来学会调用工具

比如问模型:「这是一个CSV文件,你可以描述它里面有什么吗?」

它会识别出:这份CSV文件包含了多年的每月通货膨胀率,年份一栏表示了每组每月通货膨胀率的年份。

如上所示,Llama 3.1支持8种语言,因此可以胜任多语言的翻译。

我们可以让它将童话故事《汉泽尔与格莱特》(糖果屋)翻译成西班牙语。

在推理完成后,它还贴心地为我们提供了更详细的出行穿衣指南、行李清单。

再接下来,若想自定义程序,AI代码助手为我们提供了相应的代码建议——调整宽度和高度。

并行效率

要在1.6万张GPU上训练405B的模型,仅仅是考虑并行和故障处理,就已经是一个大工程了。

除了模型本身,论文对训练过程使用的并行化方案,以及存储、网络等基础设施都进行了阐述。

Llama 3.1的训练采用4D并行(张量 流水线 上下文 数据),在BF16精度下,GPU利用率(MFU)约为38%~41%。

使用Llama 3将Python代码(左)转换为PHP代码(右),以使用更广泛的编程语言来扩充SFT数据集

数学推理

训练擅长数学推理的模型,面临着几大挑战,比如缺乏提示、缺乏真实的CoT、不正确的中间步骤、需要教模型使用外部工具、训练和推理之间的差异等。

为此,Meta采用了以下方法:解决提示不足问题、增强训练数据中的逐步推理过程、过滤错误的推理过程、结合代码和文本推理、从反馈和错误中学习。

Llama 3执行多步骤规划、推理和工具调用来解决任务

基于提供文件,要求模型总结文件内容、查找并修复错误、优化代码、执行数据分析或可视化等

事实性

对于LLM的公认挑战幻觉问题,Meta采取了幻觉优先的方法。

他们遵循的原则是,训练后应该使模型「知道它知道什么」,而不是添加知识。

可操纵性

对于Llama 3,Meta通过带有自然语言指令的系统提示,来增强其可操纵性,特别是在响应长度、格式、语气和角色/人格方面。

小扎:开源AI是未来

众所周知,小扎一直是开源AI的忠诚拥趸者。

这次不仅是发布一个新的最强模型那么简单,而是誓要让开源AI走上神坛。

「今天,几家科技公司正在开发领先的封闭模型,但开源正在迅速缩小差距。」

小扎敢直接点名自然有他的实力作为底气,去年,Llama 2还落后于前沿的旧一代模型。

而今年,Llama 3在性能方面已经能与其他巨头大模型分庭抗礼了。

Llama 3.1 405B作为第一个前沿级别的开源AI模型,除了相对于封闭模型显著更好的成本/性能比之外,405B模型的开放性使其成为微调和蒸馏小型模型的最佳选择。

为什么开源AI对开发者有益?

对于开发者来说,坚持开源模型有五大好处:

第一,开源模型允许开发者自由地训练、微调和蒸馏自己的模型。

每个开发者的需求不同,设备上的任务和分类任务需要小模型,而更复杂的任务则需要大模型。

利用最先进的开源模型,开发者可以用自己的数据继续训练,并蒸馏成理想大小。

第二,可以避免被单一供应商限制。

开发者不希望依赖于自己无法运行和控制的模型,也不希望供应商改变模型、修改使用条款,甚至完全停止服务。

而开源使得模型可以轻松切换和部署,从而打造一个广泛的生态系统。

第三,保护数据安全。

开发者在处理敏感数据时,需要确保数据的安全,这就要求他们不能通过API发送给闭源模型。

众所周知,由于开发过程更透明,因此开源软件通常更安全。

第四,运行高效且成本更低。

开发者运行Llama 3.1 405B的推理成本只有GPT-4o的一半,无论是用户端还是离线推理任务。

第五,长远眼光来看,开源将成为全行业标准。

实际上,开源的发展速度比闭源模型更快,而开发者也希望能够在长期具有优势的架构上构建自己的系统。

在小扎看来,Llama 3.1的发布将成为行业转折点,让开源变得愈发势不可挡。 #长文创作激励计划#

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
聊天别太正经!学会皮一下,感情迅速升温
“已读不回”像一根刺,扎进99%的聊天窗口。 别急着拉黑,也许只是对方没..
16. LangChain ChatPromptTemplate多模态应用实战
多模态 AI 是具备全感官交互能力的智能系统,集感知、理解、内容生成于一..
全球八大加密聊天软件深度测评!选对工具太重要
数字化时代,信息泄露、数据窃取早已不是新鲜事,选对一款靠谱的加密工具..
两个人最保密的聊天软件分享
日常和在意的人聊天,总希望拥有一片专属小天地。不想被熟人打扰,不想聊..
Open WebUI语音聊天踩坑实录:4种方案实测,GPT-Audio可用?..
一、聊一句等40秒?Open WebUI语音党集体破防谁懂啊!用Open WebUI做语音..
你聊天记录不想上云?用 NAS 搭建本地加密聊天服务GUPT..
随着网络的发展,关键词封锁越来越严重,所以其实我想跟朋友们聊点私密的..
2026年社交辅助与聊天破冰软件测评:谁在真正解决脱单难题?..
在2026年的今天,数字通讯的极速发展让认识新朋友变得无比简单。手指轻轻..
苹果CarPlay接入马斯克的Grok模型,在车内和AI自然聊天
IT之家 5 月 9 日消息,科技媒体 9to5Mac 昨日(5 月 8 日)发布博文,报..
终于来了!DeepSeek灰度测试聊天记录搜索功能,非常实用..
最近AI 圈又悄悄搞了个大动作!5 月 12 日消息,据快科技报道,DeepSeek..
关于作者
婆罗花开(普通会员)
文章
2021
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体109997

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索