
S.H.E 2007年发行的歌曲《中国话》里面有一段歌词:
好聪明的中国人,好优美的中国话......
全世界都在学中国话,
孔夫子的话,越来越国际化,
全世界都在讲中国话,
我们说的话,让世界都认真听话。
时隔20年,AI时代下,DeepSeek梁文锋又在全球“长脸”了。
如今,硅谷AI工程师都开始用DeepSeek,而非GPT-5.5,或Claude Opus模型。
Ramp 最新调查报告显示,DeepSeek 首次登上了“软件趋势榜单”第一。
该榜单主要追踪的是企业向某软件供应商的首次采购情况,这也意味着DeepSeek成为该平台上增速最快的软件之一。
主要原因在于,“美国AI太贵了”。而中国的DeepSeek-V4 Flash模型性价比高,API价格永久下调 75%、模型成本压至行业新低。
怎么形容呢,DeepSeek堪称“AI界拼多多”,果然名副其实。
硅谷悄悄抢疯了。

DeepSeek疯抢的两大原因
当前,Claude CoWork和Codex是最火的两个软件,也是我每天都在用的AI产品。
所以,我非常清楚,当前硅谷AI圈选择DeepSeek的核心原因:
1、价格差距100倍。
有数据统计,硅谷开发工程师每个月跑Claude Opus 4.7模型,需要投入25000美金左右,而每百万tokens价格是25美金。
但做同样的业务,DeepSeek每百万tokens成本才0.28美元,一个月才需要至少280美金。
你可以理解,CC Switch是一个中转站,通过本地host修改等方式,让Agent产品直接接入DeepSeek、Qwen等第三方模型,有点类似于龙虾接入不同的model方式。
本来上个月依然还是只能接入Claude。
但5月底最新版发布之后,除了Codex ,CC Switch终于稳定支持Codex接入DeepSeek模型,让第三方模型能够体验到两款顶级Coding Agent。
再加上V4系列、Qwen 3.6系列、Kimi K2.6系列模型开始支持AI Coding Agent。
因此,价格足够低、开源、性能足够强的DeepSeek-V4 Flash,成为硅谷AI圈争抢关注的焦点。
根据openrouter数据,通过DeepSeek V4 Flash消耗的token总数超过了3.35万亿。
真的是遥遥领先。
DeepSeek下半场核心:AI技术生态
最近关于DeepSeek的还有两个消息值得关注。
1、本周报道称,DeepSeek 正准备在其首轮外部融资中筹集约 500 亿元人民币(约合 74 亿美元)。
可能的估值:520亿美元至590亿美元。
投资者名单才是真正的焦点:腾讯和宁德时代有望成为最大的外部投资者。网易、京东等互联网大厂也在洽谈中。
而DeepSeek创始人梁文锋或将投入200亿元人民币自有资金。
2、另一则算力消息补充了DeepSeek全貌。
6月5日,“深圳发布”消息称,深圳河套学院AI训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为有关团队,协同深智城AI算力平台,面向国产算力大模型训练开展联合攻关。
依托昇腾910C国产AI算力集群,完成1.6万亿参数大模型DeepSeek-V4-Pro全参数后训练。

换句话说,该团队成功进行了模型“全参数”后训练,这意味着模型的整个架构都得到了更新和改进,而没有任何缩水或“偷工减料”。
虽然,国产芯片在支持人工智能推理方面取得了成功,但这只是一个相对简单的过程。
而大模型训练,是一个更为复杂的过程,即构建或改进模型的“大脑”。
如果说初始“预训练”是通过吸收大量数据来教会模型如何说话,那么后训练则是通过遵循人类指令、安全规则和特定任务来教会模型如何工作。
此前,训练算力层面一直依赖NV卡,面临诸多挑战。
本质上来说,国产GPU和AI芯片里面,除了昇腾之外,很少有真正实现“训推一体”的技术能力,大部分依然是推理能力大于训练能力。
所以,去年推理卡卖的不错,本质还是企业不需要再花更多的钱训练模型了,如何蒸馏、调优、做奖励模型、做Infra等,才是核心。
今年4月发布的DeepSeek V4系列模型,算力层面吗采用了昇腾集群与英伟达集群共同加持。
DeepSeek-V4报告指出,将工作负载约束转化为芯片设计要求:内存、带宽、功耗预算、通信比率和低精度部署。
如今,新模型来了、新国产算力也来了,最后加上新一轮融资。
这意味着:DeepSeek未来不会再作为中国的一个探索型的AI实验室。
当然,这并不意味着DeepSeek会取代OpenAI或Anthropic。
简单来说,随着企业对DeepSeek模型使用需求的上升,成本压力正从开发者实验转移到企业预算。
Ramp Economics Lab 的首席经济学家 Ara Kharazian 在周三的报告中指出,值得注意的是,美国公司直接向 DeepSeek 付款,这表明他们直接通过 DeepSeek 发送和接收数据,而不是将 DeepSeek 的开源模型托管在自己的内部服务器上。
“目前看来,企业似乎又回到了 DeepSeek 平台,”Kharazian 表示,并补充说他不会“过分夸大这一趋势的持久性”。
如果将DeepSeek融资、算力优化、模型需求三点结合起来,情况就更清晰了:
DeepSeek 正在成为一个新的案例,检验稀缺计算资源能否实现经济效益,国产芯片能否通过软件优化缩小差距,以及中国厂商能否克服算力制约风险,将开发者采用转化为企业实际支出。
所以,总结来说:
DeepSeek已经进入到下半场——
500亿融资情况是焦点,
而算力 模型需求带来的国产AI生态,将是梁文锋的新故事。
相关文章





猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113372