
今日要点
1️⃣ DeepSeek V4 正式发布,多项基准测试接近 GPT-4o 水平
2️⃣ 价格是最大杀器:API 成本约为 GPT-4o 的 1/10
3️⃣ 开源权重同步放出,社区可本地部署
4️⃣ 上下文窗口支持 128K,与主流顶流持平
5️⃣ 多模态能力首次加入,支持图像理解
6️⃣ 推理效率大幅优化,H100 GPU 上的吞吐量提升40%
7️⃣ 母公司幻方量化背景:低调的中国AI实力派
8️⃣ 已在 HuggingFace、Replicate 等平台上线
9️⃣ 业内评价:「这是给 OpenAI 和 Anthropic 的最大挑战」
资本市场上,幻方相关概念股近期持续受到关注
━━━━━━━━━━━━━━━━━━━━━━
详细分析
DeepSeek V4 核心能力拆解
基准测试成绩(官方数据):
| 基准 | GPT-4o | Claude 3.5 | DeepSeek V4 |
| --------- | ------ | ---------- | ----------- |
| MMLU | 88.7% | 88.3% | 87.9% |
| HumanEval | 90.2% | 92.0% | 91.4% |
| MATH | 76.6% | 78.3% | 77.1% |
结论:V4 已进入「前沿模型」俱乐部,与 GPT-4o、Claude 3.5 的差距在 1-2 个百分点以内,普通用户几乎感知不到差异。
价格对比(每1M Tokens):
• GPT-4o:$5(输入)/ $15(输出)
• Claude 3.5 Sonnet:$3(输入)/ $15(输出)
• DeepSeek V4:$0.27(输入)/ $1.1(输出)
是的,你没看错。DeepSeek V4 的价格约为 GPT-4o 的 1/18!
为什么 DeepSeek 能做到这么便宜?
① 架构优化:全新 MoE(Mixture of Experts)架构,每次推理只激活部分专家网络,同等性能下 GPU 消耗减少 60%
② 预训练数据策略:幻方拥有国内顶级算力集群,且在预训练中使用了大量高质量中文数据,中文理解、数学推理等任务上甚至优于 GPT-4o
③ 商业定位:低价策略不是为了赚 API 钱,而是:积累用户 → 打磨产品 → 建立生态
谁最受伤?
OpenAI:GPT-4o 的技术领先优势正在被快速侵蚀,$5 vs $0.27 的价格差会让大量开发者迁移
Anthropic:Claude 3.5 的「安全牌」越来越难打,中文场景下 V4 对齐工作也更扎实
Google:Gemini 1.5 Pro 的 1M Token 上下文优势被 V4 的 128K 追上
中小开发者:最大的受益者!以前「穷就用不起 GPT-4」,现在花同样的钱可以用上顶级模型
━━━━━━━━━━━━━━━━━━━━━━
本周AI Agent动态
Hollow(开源自修改Agent系统)
一个可以动态修改自己代码的 AI Agent。传统 Agent 只能在固定工具集内工作,Hollow 可以「自我进化」,根据任务需求实时扩展能力。这代表了 Agent 架构的一个重要方向:从工具调用者 → 自我改造者。
TurnZero(LLM持久化上下文)
解决大模型「冷启动」问题的新型 MCP 服务器。传统模式下,每次对话 AI 都要重新加载上下文;TurnZero 让工作流、编码规范等「持久化」,一次加载、全程生效。对重度 Copilot 用户来说是效率利器。
Pulsarbot(云端Agent计算机)
给 AI Agent 配备「自己的云端电脑」。Agent 可以在隔离环境中运行浏览器、操作文件、编写代码,完全自主。这个方向被认为是「Agent 取代人类操作电脑」的早期形态。
━━━━━━━━━━━━━━━━━━━━━━
明日展望
1. DeepSeek V5 预计Q3发布,目标是在所有基准上超越 GPT-4o
2. OpenAI 反击:据传 GPT-5 正在加速开发,可能提前至夏季发布
3. 价格战蔓延:预计 Google、Anthropic 在年内大幅下调 API 价格
4. 开源社区爆发:DeepSeek V4 权重已开源,预计下周内出现大量 Fine-tune 版本
5. 中国AI出海加速:DeepSeek 的低价策略将抢占东南亚、拉美市场
━━━━━━━━━━━━━━━━━━━━━━
️ #DeepSeekV4 #AI大模型 #性价比 #开源AI #GPT4o #Agent系统
━━━━━━━━━━━━━━━━━━━━━━
深度 | 2026年5月2日 晚间版
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106501