> 自媒体 > (AI)人工智能 > DeepSeek V3.2发布!实测效果惊艳,便宜是最大优势
DeepSeek V3.2发布!实测效果惊艳,便宜是最大优势
来源:36氪
2025-12-24 22:30:22
175
管理

小雷发现,DeepSeek似乎真的很喜欢大晚上给大家突然来个惊喜。

12月1日晚,DeepSeek突然来了一波更新:V3.2版本正式上线并向所有用户开放,同时也在各个开源社区上传了V3.2的本地部署模型供所有用户使用。从官方公布的测试结果来看,DeepSeek V3.2的推理能力已经基本与OpenAI的GPT-5相近,但是其成本却远低于GPT-5,可以说仅这一点就足以让不少人为之兴奋了。

好了,废话不多说,让我们直接进入正题,看看DeepSeek这次给我们带来了哪些方面的提升。

推理更强还更便宜

DeepSeek V3.2共有两个版本,一个是在DeepSeek官方网站上给大家免费使用的DeepSeek V3.2版,另一个则是仅支持API服务访问的DeepSeek V3.2-Speciale,从官方的描述来看,Speciale版拥有更强的推理能力,其主要用于探索目前模型能力的推理能力上限。

V3.2-Speciale除了会主动进入“长思考加强”模式外,还结合了DeepSeek-Math-V2的定理证明能力,使其拥有更强的指令跟随、数学证明和逻辑验证能力。在官方测试中,V3.2-Speciale的推理基准测试成绩直接媲美最新的Gemini-3.0-Pro。

图源:雷科技

可以看到DeepSeek在计算出结果后,开始反复验证答案的正确,并且思考不同情况下该答案是否仍然正确或存在其他问题,在最后输出答案前,DeepSeek总共进行了三轮答案验证。

虽然看起来有点浪费算力,但是这种多次验证的思路却是必须的,可以更好的确保DSA机制下回答的正确率,否则就以DeepSeek的稀疏架构来说,出错的概率其实会比其他AI更高。

然后我又设计了一个多步骤的任务链处理:

搜索北京今天气温

把气温转换为华氏温度

调用工具检查你的换算是否正确

最后用一句话总结今天适合不适合户外活动

注:你必须自己决定什么时候调用工具,不能一次性完成。

我们来看看DeepSeek的思考过程:

图源:雷科技

可以看到其很好的理解了提问的需求,并且开始分步骤使用搜索和数学工具来解决问题,最终输出了回答:

图源:雷科技

回答整体上是正确按照步骤做了回答,并且最后还自动选择数学工具对转换结果进行确认,但是也有一个奇葩的地方,DeepSeek把思考过程中提到过的“总结今天适合不适合户外运动”的回答弄丢了,不过瑕不掩瑜,思考过程来看,DeepSeek确实具备自主决策使用哪些工具的能力。

作为对比,另一个AI在面对相同的问题时,虽然理解“调用工具”等要求,但是在执行到实际步骤时却变成直接搜索对应数据来填充回答:

图源:雷科技

事实上,在DeepSeek的思考模式工具调用教程里也有类似的问题,不过那个教程中展示的是如何通过多轮对话和调用多个工具来提高最终答案的质量。

你可以这么理解:DeepSeek以前只能在你提问时通过回忆(模型参数)来组合答案,现在则可通过拆解问题、逐个提问并针对问题使用不同工具(如搜索、数学、编程等)来给出更好的解决方案,最后再整合所有回答并重新排版成完整答案。

因为整体时间有限,所以小雷也就没有设计更难的问题去测试DeepSeek,有兴趣的朋友现在就可以登录DeepSeek官网亲自试试。

最强开源?OpenAI和Google又要头疼了

DeepSeek V3.2强吗?确实强,但是并没有断崖式领先,从测试结果来看与GPT-5 High及Gemini 3.0 Pro都是有来有回。但是,当一个能在多个权威基准里对标 GPT-5、Gemini 3.0 Pro、推理成本却低到只有行业主流模型三分之一甚至更低的模型以完全开源的方式放出来,足以对整个市场造成冲击——这也是DeepSeek一直能颠覆行业的根本逻辑。

此前,业界一直有个声音:“开源模型永远落后闭源模型8个月”,这个结论不好说对不对,但是DeepSeek V3.2的发布显然终结了这个争论。DeepSeek继续坚持全量开源,尤其是在引入DSA这种能显著降低成本、提升长文本能力的底层技术之后,其实就让开源模型的角色从“追赶者”变成了反向倒逼闭源巨头的“挑战者”。

更重要的是,DSA带来的成本革命会对AI大模型的商业化造成显著影响,因为AI大模型的训练和推理本质上都还存在成本高的问题,一句“成本下降60%”背后其实不只是关系到运营成本,还有前期部署成本,整体成本下降也意味着即使是小型企业都可以借助DeepSeek训练出更强的模型。

而在推理端,长文本交互的价格足够低后,高级AI应用(智能体、自动化工作流、长链推理等)也将不再局限于企业级市场,而是能够更好地被推广到消费级市场使用,甚至可能极大加速“AI工具取代传统软件”的趋势,使AI真正渗透到操作系统层级的日常使用中。

对于普通用户而言,或许只是觉得多了个免费的好用模型,但是从在几个月、半年后,或许你会发现各种硬件、软件的AI体验又有了质的提升,不用怀疑,这背后大概率有DeepSeek的功劳。

本文来自“雷科技”,36氪经授权发布。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
花20万买SUV,到底怎么才算良心车?实测5款家用SUV,句句大实话..
你有没有过这种纠结:预算20万上下,想买台靠谱家用SUV,怕费油、怕小毛..
15万无对手?5款“闭眼入”燃油SUV,省心省钱抗造,家用车天花板..
15万左右买SUV别瞎选了,就这五款你闭着眼睛干就完事儿,家用省油省心全..
2026年重磅新车展望 聚焦SUV 新能源仍是重点
【中关村在线原创技术】2026年2月1日,国内多家主流车企陆续发布2026年1..
马年硬派SUV上新,谁会是新爆款?iCAR V27/哈弗猛龙PLUS/银河战舰..
iCAR V27作为奇瑞子品牌旗下中大型硬派SUV,目前实车已经到店,上市在即..
2026耐用SUV四强!十年不大修,家用闭眼买都不亏
阅读之前,麻烦用你发财的小手点点"爱心",创作不易,(木子李随笔)感谢大..
别再被销售忽悠!SUV和轿车根本不是一类车,弄懂5点再选绝不后悔..
买车时绕不开的灵魂拷问:到底选SUV还是轿车?身边人说法不一:有人说SUV..
四款王炸SUV,公认的耐用王
四款王炸SUV,公认的耐用王。有很多车主到现在还是看不起国产车,买车非..
2026买车先别急!8款重磅SUV来袭,自主合资全都有
阅读之前,麻烦用你发财的小手点点"爱心",创作不易,(木子李随笔)感谢大..
买SUV不踩坑:国产4款+合资3款+豪华3款,照着需求选就对了..
大家好我是心心念念,每天给大家带来最新动态,不赶节奏,内容随缘更,但..
关于作者
小北(普通会员)
文章
1837
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103435

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索