> 自媒体 > (AI)人工智能 > DeepSeek V3.2双版本齐发:推理比肩GPT-5,Speciale版夺国际奥赛金牌
DeepSeek V3.2双版本齐发:推理比肩GPT-5,Speciale版夺国际奥赛金牌
来源:PConline太平洋科技
2025-12-05 08:09:54
155
管理

【太平洋科技快讯】12 月 2 日消息,深度求索公司昨日发布 DeepSeek V3.2 正式版。此次发布包含两个版本:适用于日常场景的 DeepSeek-V3.2,以及目标将开源模型推理能力推向极致的长思考增强版 DeepSeek-V3.2-Speciale。官方网页端、 App 及 API 均已更新为 V3.2 正式版,而 Speciale 版本目前仅通过临时 API 开放,供社区评测与研究。

DeepSeek V3.2 旨在平衡推理能力与输出长度,适合日常使用,如问答及通用 Agent 任务场景。在公开推理基准测试中,其性能达到 GPT-5 水平,略低于 Gemini-3.0-Pro。相比同类长思考模型,V3.2 大幅降低了输出长度与计算开销。

表1:DeepSeek-V3.2 与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 总量约数)

DeepSeek V3.2 是该公司推出的首个将思考融入工具使用的模型,并同时支持思考模式与非思考模式的工具调用,通过大规模 Agent 训练数据合成分发,显著提升模型的泛化能力,在相关评测中达到开源模型最高水准。

表2:DeepSeek-V3.2 与其他模型在各类智能体工具调用评测集上的得分

DeepSeek-V3.2-Speciale 集成了长思考与 DeepSeek-Math-V2 的定理证明能力,专注于探索模型推理边界。它在 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 等顶级国际竞赛中均斩获金牌,其中 ICPC 成绩相当于人类选手第二名。该版本在高度复杂任务上表现大幅优于标准版,但计算成本更高。目前仅用于研究,不支持工具调用,也未针对日常对话优化。

V3.2 的思考模式新增对 Claude Code 的支持,用户可通过更改模型名或快捷键开启。但该模式尚未充分适配 Cline、RooCode 等非标准工具调用组件,官方建议在此类场景下使用非思考模式。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
泡沫人生(普通会员)
文章
2025
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112596

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索