DeepSeek 和小米同时宣布永久降价，API白菜价时代已经来了-工信会

> 自媒体 > （AI）人工智能 > DeepSeek 和小米同时宣布永久降价，API白菜价时代已经来了

DeepSeek 和小米同时宣布永久降价，API白菜价时代已经来了

来源：智能体实验室

2026-05-28 09:17:02

160

管理

这两天AI圈最大的新闻，可能就是Deepseek和Mimo降价。

5月24号，DeepSeek 官宣：V4-Pro 之前的 2.5 折限时优惠，直接转为永久定价。也就是说，原定5月31号到期的折扣，以后还是这个价。

紧接着，5月27号凌晨，小米MiMo也跟着降价：V2.5全系API永久降价，最高降幅 99%。

DeepSeek V4-Pro：从限时折扣到永久白菜价

DeepSeek V4-Pro 可以说当前国内文本处理的顶级模型，在今年4月24号发布。1.6 万亿总参数，490 亿激活参数，MoE 架构，原生支持 100 万 Token 上下文。MIT 开源协议。

架构层面有几个关键改进：混合注意力机制（CSA HCA）让 V4-Pro 相比 V3 的单 Token 推理 FLOPs 降低了 73%，KV 缓存减少了 90%。简单说，同等性能下，推理成本大幅缩减，这也是它为什么敢降价的底气。

跑分方面，V4-Pro 在 SWE-bench Verified 等编码基准上已经能跟 Claude Opus 4.7 和 GPT-5.5 正面交锋。实际使用差距肯有，但整体还算不错了。

调整后的价格如下：

计费类型

价格（元/百万 Tokens）

说明

输入（缓存命中）

¥0.025

几乎可以忽略不计

输入（未命中）

¥3

首次请求价格

输出

¥6

永久价格，不再限时

缓存命中 0.025 元/百万 Token 是什么概念？相当于你调用一百万个 Token 的输入，花两分钱。

对比 GPT-5.5 和 Claude Opus 4.7 的定价，DeepSeek V4-Pro 便宜了大约 5 到 10 倍。而且这次是永久价。

MiMo V2.5：降价 99%

小米的MiMo V2.5是今年4月22号发的，和Deepseek前后脚，同样是 MoE 架构，总参 1.02 万亿，活跃参数 420 亿。支持原生全模态（文本、图像、视频、音频），100 万 Token 上下文。

定位明确：Agent 场景优先。擅长长程任务规划、复杂软件工程、多轮工具调用。在 Artificial Analysis 的评测中，MiMo-V2.5-Pro 在开源大模型综合智能指数并列第一，Agent 专项指数也是开源榜首。

至少比MiniMax要好用。

这次降价有三个方面：

第一，全线永久降价：最高降幅 99%，直接把 API 价格打到地板。

第二，取消长度区分：以前 1M 长上下文和短文本的计费不一样，现在统一了。不再因为你用了长上下文就额外收费。

第三，Token Plan 升级：价格不变，可用额度提升 5 到 8 倍。而且所有活跃订阅用户的已用额度全部重置为零，刷一波好感。

MiMo-V2.5-Pro 调整后的定价：

计费类型

价格（元/百万 Tokens）

说明

输入（缓存命中）

¥0.025

与 DeepSeek V4-Pro 持平

输入（未命中）

¥3

不再区分上下文长度

输出

¥6

永久价格

价格和DeepSeek V4-Pro一样。

降价背后：推理成本开始下降

降这么多，不会亏钱吗？

DeepSeek V4 的架构改进让单 Token 推理成本相比 V3 降了 73%，KV 缓存砍掉 90%。这意味着同样的 GPU 集群，能服务的用户量翻了好几倍。技术红利直接让利到定价上。

小米这边的路径也类似。MiMo V2.5 全面部署了基于 SGLang HiCache 的三级缓存体系（GPU 显存→主机内存→分布式存储），配合混合注意力机制中的滑动窗口注意力（SWA），KV Cache 传输量降到原来的 1/7，可缓存 Token 量提升了 5 倍。

简单说：推理效率提上去了，每个 Token 的边际成本就下来了。降价是技术进步的自然结果，不是纯粹靠补贴烧钱。

相较于 2024 年初，目前同等智能水平的模型 API 成本已下降了 90%-97%。

Deepseek v4 Pro 对比 Mimo v2.5 Pro

产品差异如下：

维度

DeepSeek V4-Pro

MiMo V2.5-Pro

总参数

1.6 万亿

1.02 万亿

激活参数

490 亿

420 亿

上下文

100 万 Token

多模态

文本为主

原生全模态（文/图/视频/音频）

开源

MIT 协议

开源

核心优势

文本处理、编码推理、性价比极致

Agent 场景、多模态、人车家生态

输出价格

¥6/百万 Token

简单来说：

写代码、龙虾工具，用MiMo V2.5 Pro，支持多模态，工具调用能力更强；

写汇报、业务材料，用Deepseek V4 Pro，文字处理能力强，长上下文处理有优势。

API只会越来越便宜

有一个反直觉的事实：Token 价格越来越便宜，但很多企业的AI账单反而越来越贵。

这就是杰文斯悖论，单价降了，但企业所需要的Token消耗量是几何级增长的。一个AI编程任务动辄上百万Token，一个复杂的Agent工作流可能消耗几千万的Token。便宜了之后大家用得更多。

另外市场正在分化，DeepSeek和小米在疯狂降价的同时，也有厂商在悄悄涨价或者取消优惠。比如阿里云、智谱、腾讯云等；相信不久也会降的。

对开发者和企业来说，肯定是好事。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

DeepSeek永久降价，其实是瞄准了10万亿美元？

1个月前

DeepSeek 5个“暗黑指令”，第4个专治AI废话，90%人不敢用

1个月前