> 自媒体 > (AI)人工智能 > 国庆前放大招!DeepSeek-V3.2-Exp发布并开源,API成本将降低50%以上
国庆前放大招!DeepSeek-V3.2-Exp发布并开源,API成本将降低50%以上
来源:华尔街见闻
2025-10-01 09:46:35
337
管理

国庆长假在即,Deepseek又放大招了!

9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。

该版本作为迈向下一代架构的重要中间步骤,在 V3.1-Terminus的基础上引入了团队自研的DeepSeek Sparse Attention (DSA)稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证,这种架构能够降低计算资源消耗并提升模型推理效率。

目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。

为了确保评估的严谨性,DeepSeek-V3.2-Exp 的训练设置与前代 V3.1-Terminus 进行了严格对齐。测试结果显示,该模型在各大公开评测集上的表现与 V3.1-Terminus 基本持平,有效性得到了初步验证。

DeepSeek 现已将 DeepSeek-V3.2-Exp 模型在 Huggingface 和 ModelScope 平台上全面开源,相关论文也已同步公开。

作为一款实验性版本,DeepSeek 认识到模型仍需在更广泛的用户真实场景中进行大规模测试。为便于开发者进行效果对比,DeepSeek 为 V3.1-Terminus 版本临时保留了 API 访问接口,且调用价格与 V3.2-Exp 保持一致。该对比接口将保留至北京时间 2025 年 10 月 15 日 23:59。

此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA两种版本。团队建议社区在进行研究性实验时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。

⭐星标华尔街见闻,好内容不错过⭐本文不构成个人投资建议,不代表观点,市场有风险,投资需谨慎,请独立判断和决策。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
别再瞎折腾ChatGPT!3招让效率暴增8倍(建议收藏
你是不是也这样?打开ChatGPT,手放在键盘上想了半天,打出一句:“帮我..
GPT-4面对未知88%却在编造,不说不知道是设计层面的原因吗?..
2022年,一位资深律师用ChatGPT准备一份法庭文件。他让AI找到相关的过往..
GPT-5.5 和 GPT-4 差距到底有多大?一次偏实战的基准测试对比..
最近很多开发者和内容团队都在关注一个问题:如果 GPT-5.5 逐步进入应用..
中指数据 AI Agent发布!地产从业者的一站式智能解决方案..
中指数据 AI Agent,拥抱智能高效的地产工作新范式!以大数据 AI 深度赋..
港股AI决策第一股|深演智能锚定Agentic Software长期价值..
2026年5月27日,深演智能(02723.HK)正式登陆港交所,上市首日股价大涨..
最强AI调解员弥合分歧仅1/3,KAIST测试为何戳破高分泡沫?..
假设你请了8位当前最强的AI来当调解员,让它们各自独立处理600场从真实公..
首周调用1万亿Token,Agnes免费全模态API为何引爆开发者圈?..
过去一年,任何一个深度使用AI的开发者都会告诉你同一件事:AI越来越贵了..
新加坡全模态API:Agnes AI 文本/图像/视频三合一,无限期免费用!..
喝茶闲聊不谈深奥技术,只分享日常能用得上的实用好物说实话,前两天我刷..
深夜跟AI聊了2小时,聊到最后有点后背发凉
晚上闲着没事,让AI帮我解了一道今年高考数学压轴题。2026年新高考I卷,..
关于作者
卿嫣(普通会员)
文章
2058
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113433

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索