实测阿里Qwen3.6-Plus：8分钟做了个官网，被北京地铁绕晕-工信会

> 自媒体 > （AI）人工智能 > 实测阿里Qwen3.6-Plus：8分钟做了个官网，被北京地铁绕晕

实测阿里Qwen3.6-Plus：8分钟做了个官网，被北京地铁绕晕

来源：智东西

2026-05-12 13:13:03

137

管理

在SWE-bench Verified、Terminal-Bench 2、NL2Repo等编程基准测试中，Qwen3.6-Plus取得了超过GLM-5、Kimi K2.5的成绩，不过在部分基准测试中的得分仍低于Claude Opus 4.5。

在Claw-Eval、QwenClawBench等真实世界Agent能力评测中，Qwen3.6-Plus的表现同样超过了多款国产模型，与Claude Opus 4.5同处一个梯队。

将编程能力与多模态能力结合后，Qwen3.6-Plus还解锁了视觉智能体编程能力，可基于界面截图、设计稿或自然图文描述，完成前端页面生成、代码补全、交互修改等任务。

目前，Qwen3.6-Plus的API已经开放调用，用户可在Qwen Chat中体验到这一模型。这次阿里还为API引入了一项新功能“preserve_thinking”，可保留消息中所有前序轮次的思维内容，该功能推荐用于智能体任务。其API的原价为4元/百万输入tokens，12元/百万输出tokens，目前有限时5折的优惠。

在实测中，我们的这一案例融合考察了编程与工具调用能力，要求Qwen3.6-Plus统计A股目前股价最高的10家公司，并生成完整统计网页，带有每家公司的跳转链接。

在任务执行过程中，Qwen3.6-Plus调用了7轮搜索工具，统计了数十个网站的数据，最终交付了如下的结果，耗时大概7分钟左右。

Qwen3.6-Plus生成的排名

Qwen3.6-Plus选择了权威的数据来源，右侧查看详情链接的跳转正常，排名正确，数据则取的是近似值。在思维链中可以看到它多次在同一个问题上反复思考，搜索多次但获得的内容差不多，在任务执行速度和token效率上仍有一定提升空间。

右侧是Qwen3.6-Plus的思维链摘要

接下来，我们又要求Qwen3.6-Plus生成一个《潜水员戴夫》的同款游戏，不过，Qwen3.6-Plus先是拒绝了这一要求，称它无法直接生成可执行的游戏文件，但可以为我生成核心概念美术图，并提供一套完整的《潜水员戴夫》风格游戏设计蓝图开发指南基础代码框架，作为开发起点。

为考察其视觉推理能力，我们在之前的地铁路径规划任务上加了点难度，假设某一线路遇到了极端天气停运了，看看模型还能不能反应过来。

Qwen3.6-Plus通过较长时间的思考后，得出了两个结论，第一个结论其实是正确的，但是它判断这条路线有点复杂，于是认为可以在“牡丹园站换乘昌平线”，这样更直接。Qwen3.6-Plus的最终结论有个bug，昌平线可能至少要等到2029年才能和19号线在牡丹园换乘。

在其他多模态能力方面，阿里官方还展示了多个demo。比如，Qwen3.6-Plus可以对视频进行分析，并生成图文并茂的讲义。

结语：阿里全面押注原生多模态

随着Qwen3.6-Plus的发布，千问团队称，他们近期的工作重心将全面转向Qwen3.6系列的整体发布。在未来不久，千问还将开源更小规模的模型版本。同时，性能更强的旗舰模型Qwen3.6-Max也将很快亮相。

值得注意的是，自Qwen3.5发布后，千问已经全面将其主力模型Qwen转向了原生多模态。该团队称，他们希望模型逐步演进为一个能够在真实环境中持续感知、推理和行动的原生多模态智能体。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

突发，阿里Qwen负责人林俊旸官宣卸任

2个月前

首个Qwen3.6开源模型来了！编程视觉双提升，还兼容OpenClaw

2个月前