这两天AI圈最大的新闻,可能就是Deepseek和Mimo降价。
5月24号,DeepSeek 官宣:V4-Pro 之前的 2.5 折限时优惠,直接转为永久定价。也就是说,原定5月31号到期的折扣,以后还是这个价。
紧接着,5月27号凌晨,小米MiMo也跟着降价:V2.5全系API永久降价,最高降幅 99%。
DeepSeek V4-Pro:从限时折扣到永久白菜价DeepSeek V4-Pro 可以说当前国内文本处理的顶级模型,在今年4月24号发布。1.6 万亿总参数,490 亿激活参数,MoE 架构,原生支持 100 万 Token 上下文。MIT 开源协议。
架构层面有几个关键改进:混合注意力机制(CSA HCA)让 V4-Pro 相比 V3 的单 Token 推理 FLOPs 降低了 73%,KV 缓存减少了 90%。简单说,同等性能下,推理成本大幅缩减,这也是它为什么敢降价的底气。
跑分方面,V4-Pro 在 SWE-bench Verified 等编码基准上已经能跟 Claude Opus 4.7 和 GPT-5.5 正面交锋。实际使用差距肯有,但整体还算不错了。
调整后的价格如下:
计费类型
价格(元/百万 Tokens)
说明
输入(缓存命中)
¥0.025
几乎可以忽略不计
输入(未命中)
¥3
首次请求价格
输出
¥6
永久价格,不再限时
缓存命中 0.025 元/百万 Token 是什么概念?相当于你调用一百万个 Token 的输入,花两分钱。
对比 GPT-5.5 和 Claude Opus 4.7 的定价,DeepSeek V4-Pro 便宜了大约 5 到 10 倍。而且这次是永久价。
MiMo V2.5:降价 99%小米的MiMo V2.5是今年4月22号发的,和Deepseek前后脚,同样是 MoE 架构,总参 1.02 万亿,活跃参数 420 亿。支持原生全模态(文本、图像、视频、音频),100 万 Token 上下文。
定位明确:Agent 场景优先。擅长长程任务规划、复杂软件工程、多轮工具调用。在 Artificial Analysis 的评测中,MiMo-V2.5-Pro 在开源大模型综合智能指数并列第一,Agent 专项指数也是开源榜首。
至少比MiniMax要好用。
这次降价有三个方面:
第一,全线永久降价:最高降幅 99%,直接把 API 价格打到地板。
第二,取消长度区分:以前 1M 长上下文和短文本的计费不一样,现在统一了。不再因为你用了长上下文就额外收费。
第三,Token Plan 升级:价格不变,可用额度提升 5 到 8 倍。而且所有活跃订阅用户的已用额度全部重置为零,刷一波好感。
MiMo-V2.5-Pro 调整后的定价:
计费类型
价格(元/百万 Tokens)
说明
输入(缓存命中)
¥0.025
与 DeepSeek V4-Pro 持平
输入(未命中)
¥3
不再区分上下文长度
输出
¥6
永久价格
价格和DeepSeek V4-Pro一样。
降价背后:推理成本开始下降降这么多,不会亏钱吗?
DeepSeek V4 的架构改进让单 Token 推理成本相比 V3 降了 73%,KV 缓存砍掉 90%。这意味着同样的 GPU 集群,能服务的用户量翻了好几倍。技术红利直接让利到定价上。
小米这边的路径也类似。MiMo V2.5 全面部署了基于 SGLang HiCache 的三级缓存体系(GPU 显存→主机内存→分布式存储),配合混合注意力机制中的滑动窗口注意力(SWA),KV Cache 传输量降到原来的 1/7,可缓存 Token 量提升了 5 倍。
简单说:推理效率提上去了,每个 Token 的边际成本就下来了。降价是技术进步的自然结果,不是纯粹靠补贴烧钱。
相较于 2024 年初,目前同等智能水平的模型 API 成本已下降了 90%-97%。
Deepseek v4 Pro 对比 Mimo v2.5 Pro
产品差异如下:
维度
DeepSeek V4-Pro
MiMo V2.5-Pro
总参数
1.6 万亿
1.02 万亿
激活参数
490 亿
420 亿
上下文
100 万 Token
100 万 Token
多模态
文本为主
原生全模态(文/图/视频/音频)
开源
MIT 协议
开源
核心优势
文本处理、编码推理、性价比极致
Agent 场景、多模态、人车家生态
输出价格
¥6/百万 Token
¥6/百万 Token
简单来说:
写代码、龙虾工具,用MiMo V2.5 Pro,支持多模态,工具调用能力更强;
写汇报、业务材料,用Deepseek V4 Pro,文字处理能力强,长上下文处理有优势。
API只会越来越便宜有一个反直觉的事实:Token 价格越来越便宜,但很多企业的AI账单反而越来越贵。
这就是杰文斯悖论,单价降了,但企业所需要的Token消耗量是几何级增长的。一个AI编程任务动辄上百万Token,一个复杂的Agent工作流可能消耗几千万的Token。便宜了之后大家用得更多。
另外市场正在分化,DeepSeek和小米在疯狂降价的同时,也有厂商在悄悄涨价或者取消优惠。比如阿里云、智谱、腾讯云等;相信不久也会降的。
对开发者和企业来说,肯定是好事。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110891