全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。
4月24日,中国人工智能公司DeepSeek再度向开源社区投下重磅,其全新系列模型DeepSeek-V4预览版正式发布并同步开源,在Agent能力、世界知识与推理性能三大维度宣称达到国内及开源领域领先水平。
DeepSeek-V4分为Pro与Flash两个版本,均支持百万(1M)token超长上下文,两个版本均大幅降低了对计算和显存的需求。

API服务同步上线,开发者将model参数修改为deepseek-v4-pro或deepseek-v4-flash即可调用,接口兼容OpenAI ChatCompletions与Anthropic两套标准。
DeepSeek同时披露,受限于高端算力供给,Pro版本当前服务吞吐十分有限,预计下半年随华为昇腾950超节点批量上市后,Pro版本价格将大幅下调。
值得注意的是,昇腾CANN将在16点直播DeepSeek V4在昇腾平台的首发。

网友Enrico亦评价称DeepSeek V4"真的令人印象深刻,快速、智能",不过他认为输出价格为每百万token 3.48美元,"并不便宜",但表示LocalAI将推动该模型面向更广泛用户群体普及。

在推理性能方面,V4-Pro在数学、STEM及竞赛型代码评测中宣称超越当前所有已公开评测的开源模型,并取得比肩世界顶级闭源模型的成绩。

API层面,两款模型最大上下文长度均为1M,同时支持非思考模式与思考模式。
思考模式支持通过reasoning_effort参数设定推理强度,可选high或max档位。DeepSeek建议,针对复杂Agent场景应启用思考模式并将强度设为max。

本文来自华尔街见闻,欢迎下载APP查看更多
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105719