> 自媒体 > (AI)人工智能 > 曝GPT-5.5用上“全球最快芯片”,Claude慌了
曝GPT-5.5用上“全球最快芯片”,Claude慌了
来源:36氪
2026-05-28 18:30:00
170
管理

120B模型飙到2000 token/秒,CFO更放话已在跑GPT-5.5!Cerebras 560亿美元IPO首日暴涨68%,但SemiAnalysis万字拆解直指死穴。

SemiAnalysis,硅谷最硬核的芯片分析机构,4月份光是AI工具的订阅费就烧到了年化1000万美元。

其中80%花在同一个地方,Anthropic的Opus 4.6 fast模式。

它比标准模式贵6倍,但token输出速度快2.5倍!

让它跑这么快的,正是Cerebras的WSE-3,一块餐盘大小的晶圆级芯片。

这件事直接引爆了一笔246亿美元的合同,也把Cerebras一路推进了纳斯达克。5月14日首日暴涨68%,2026年至今最大科技IPO。

但Cerebras CFO Bob Komin说,这还只是开胃菜。

IPO前夜,他在采访中亮了一张没人预料到的牌——

我们服务所有模型,对模型大小没有限制。今天,我们正在跑万亿参数的模型。我们正在跑OpenAI内部的GPT-5.4和GPT-5.5。

如果这是真的,Cerebras就不只是一个「小模型快跑」的玩家了,IPO当天的疯狂涨幅立刻站得住脚。

但SemiAnalysis偏偏在同一周甩出了一篇两万字的技术拆解报告,直接把这个故事撕开了一道口子。

Cerebras公开云上,最大的生产模型是GPT-OSS,总参数120B;预览模型最大355B。曾经上过的Llama 70B和405B,后来也被悄悄下了架。

2025年最火,但体量也更大的开源模型(比如DeepSeek),从头到尾就没出现在Cerebras Cloud上。

重点来了,SRAM。

GPU用的是HBM(高带宽内存),容量大但速度相对慢。一块B300配了288GB的HBM,带宽在TB/秒级别。

WSE-3只有44GB的SRAM,但内存带宽高达21PB/秒。

SemiAnalysis做了一个很直观的对比。

同样只给一个用户生成token的场景下,GPU能实际利用的算力只有理论峰值的零头。WSE-3理论上可以把全部15.6 PFLOPS的FP16算力吃满。

差距不是百分之几十,而是数量级的。

对于小模型来说,WSE-3的44GB SRAM绰绰有余,但放到今天的大模型面前根本不够看。

DeepSeek V4有1.6万亿参数,即使用最激进的压缩方式(FP8量化),光权重就要490GB。一块WSE-3装不下,要切成至少12块塞进12块晶圆。

分布就要通信,而这也是Cerebras最致命的短板。

每块WSE-3对外带宽只有150GB/秒。

英伟达一块Blackwell GPU通过NVLink5能跑到900GB/秒,是Cerebras的6倍。被英伟达收购的Groq更夸张,单颗LPU3就有9.6Tb/秒,8倍。

速度快,但模型小、上下文短、选择少。这就是开发者今天拿到手的Cerebras。

但这里藏着一个很多人还没注意到的细节,足以改变整个竞争格局。

Cerebras与OpenAI的协议里写着一条排他条款,合同期内不得向「特定OpenAI竞争对手」出售产品。

CEO Feldman没有点名,但所有人都知道指的是谁,Anthropic。

12%股权、10亿美元贷款、246亿美元订单锁定。Cerebras已经被牢牢绑在了OpenAI的战车上。

推理战争,OpenAI刚刚换了一把枪

如今,AI军备竞赛的主战场已经变了。

训练只做一次,推理每天做数十亿次。

2026年三分之二的AI算力消耗在推理上,到2027年预计达到80%。

根据OpenAI的计划,AWS的Trainium负责理解用户输入,Cerebras负责生成输出token,GPU负责训练和长上下文,三套硬件各管一段。这套组合拳只为一件事,成本打下来,速度拉上去。

对比之下,Opus 4.6 fast的速度已经从100 token/秒退化到了70 token/秒,Cerebras也在合同里把它锁在了门外。

那么问题来了,Anthropic的极速推理方案在哪里?

参考资料:

https://x.com/dee_bosa/status/2055351401472020949?s=20

https://newsletter.semianalysis.com/p/cerebras-faster-tokens-please

本文来自微信公众号“新智元”,作者:ASI启示录,36氪经授权发布。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
呼唤(普通会员)
文章
2003
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体111009

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索