DeepSeek用0.3%成本实现GPT-4性能，为什么动摇了AI算力信仰？-工信会

> 自媒体 > （AI）人工智能 > DeepSeek用0.3%成本实现GPT-4性能，为什么动摇了AI算力信仰？

DeepSeek用0.3%成本实现GPT-4性能，为什么动摇了AI算力信仰？

来源：热点解读

2026-05-28 16:22:57

管理

DeepSeek通过算法创新，以仅557万美元的训练成本实现了与GPT-4相当的性能，这动摇了AI行业长期依赖高算力投入的信仰。当OpenAI等巨头还在推进千亿美元级算力基建时，DeepSeek用一组反常识数据撕开了行业的“算力迷信”——推理成本降至每百万Token 16元，性能却对标顶尖模型。

算法革命：小成本撬动大性能

DeepSeek的成功并非靠堆砌硬件，而是通过架构级创新将算力效率提升到新高度。其核心模型采用混合专家模型（MoE），单次推理仅激活总参数的5.5%，却能实现与密集模型相当的推理能力，直接将算力需求压缩至传统模式的40%。

更关键的是稀疏注意力机制（DSA），通过动态屏蔽非关键计算，将长序列处理的复杂度从平方级降至近似线性，在128K上下文场景下，推理速度提升40%，显存占用降低30%。

这些技术让训练总成本控制在557万美元，仅为GPT-4同类模型的1/10左右。训练过程中，DeepSeek还通过动态精度调控技术，在不同运算环节匹配最优精度，使计算资源利用率提升47%，内存占用降低32%。这意味着，AI性能的提升不再必然伴随天文数字般的算力账单。

算力信仰的动摇

当DeepSeek证明“小成本能办大事”，整个行业的底层逻辑开始受到质疑。过去十年，AI增长被简单总结为“堆算力、堆参数、堆数据”，巨头通过垄断高端GPU构建技术壁垒，中小企业则因算力鸿沟被挡在门外。

但DeepSeek的突破直接挑战了这种“算力即霸权”的思维——市场开始反问：如果算法创新能以1/10的成本实现相同效果，为什么还要为过剩的硬件支付溢价？

资本市场的反应印证了这种动摇。DeepSeek的低成本策略曝光后，英伟达单日市值蒸发5900亿美元，台积电股价跌超10%，反映了投资者对“算力至上”模式的恐慌性抛售。

更深远的影响在于产业生态：DeepSeek的开源策略使中小公司无需投入数十亿美元即可获得顶尖模型，推动AI应用从“大公司俱乐部”走向“全民共创”。例如，医疗领域已看到实际成效——华山医院通过部署DeepSeek模型，将CT病灶标记时间从30分钟缩短至10秒，诊断准确率达95.2%。

这场技术革命的核心启示是：在AI时代，效率创新比资源堆砌更具战略价值。当推理成本降至竞品的1/20，当训练周期缩短至两个月，行业竞争的焦点正从“谁有更多算力”转向“谁更聪明地使用算力”。算力信仰的动摇，或许正是AI走向普惠和实用的新起点。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

训练GPT-4用2.4亿度电，AI大模型为何成吞电怪兽？

1个月前

从GPT-1到GPT-4：ChatGPT背后的大模型进化史

1个月前