> 自媒体 > (AI)人工智能 > 实测阿里Qwen3.6-Plus:8分钟做了个官网,被北京地铁绕晕
实测阿里Qwen3.6-Plus:8分钟做了个官网,被北京地铁绕晕
来源:智东西
2026-05-12 13:13:03
81
管理

在SWE-bench Verified、Terminal-Bench 2、NL2Repo等编程基准测试中,Qwen3.6-Plus取得了超过GLM-5、Kimi K2.5的成绩,不过在部分基准测试中的得分仍低于Claude Opus 4.5。

在Claw-Eval、QwenClawBench等真实世界Agent能力评测中,Qwen3.6-Plus的表现同样超过了多款国产模型,与Claude Opus 4.5同处一个梯队。

将编程能力与多模态能力结合后,Qwen3.6-Plus还解锁了视觉智能体编程能力,可基于界面截图、设计稿或自然图文描述,完成前端页面生成、代码补全、交互修改等任务。

目前,Qwen3.6-Plus的API已经开放调用,用户可在Qwen Chat中体验到这一模型。这次阿里还为API引入了一项新功能“preserve_thinking”,可保留消息中所有前序轮次的思维内容,该功能推荐用于智能体任务。其API的原价为4元/百万输入tokens,12元/百万输出tokens,目前有限时5折的优惠。

在实测中,我们的这一案例融合考察了编程与工具调用能力,要求Qwen3.6-Plus统计A股目前股价最高的10家公司,并生成完整统计网页,带有每家公司的跳转链接。

在任务执行过程中,Qwen3.6-Plus调用了7轮搜索工具,统计了数十个网站的数据,最终交付了如下的结果,耗时大概7分钟左右。

Qwen3.6-Plus生成的排名

Qwen3.6-Plus选择了权威的数据来源,右侧查看详情链接的跳转正常,排名正确,数据则取的是近似值。在思维链中可以看到它多次在同一个问题上反复思考,搜索多次但获得的内容差不多,在任务执行速度和token效率上仍有一定提升空间。

右侧是Qwen3.6-Plus的思维链摘要

接下来,我们又要求Qwen3.6-Plus生成一个《潜水员戴夫》的同款游戏,不过,Qwen3.6-Plus先是拒绝了这一要求,称它无法直接生成可执行的游戏文件,但可以为我生成核心概念美术图,并提供一套完整的《潜水员戴夫》风格游戏设计蓝图 开发指南 基础代码框架,作为开发起点。

为考察其视觉推理能力,我们在之前的地铁路径规划任务上加了点难度,假设某一线路遇到了极端天气停运了,看看模型还能不能反应过来。

Qwen3.6-Plus通过较长时间的思考后,得出了两个结论,第一个结论其实是正确的,但是它判断这条路线有点复杂,于是认为可以在“牡丹园站换乘昌平线”,这样更直接。Qwen3.6-Plus的最终结论有个bug,昌平线可能至少要等到2029年才能和19号线在牡丹园换乘。

在其他多模态能力方面,阿里官方还展示了多个demo。比如,Qwen3.6-Plus可以对视频进行分析,并生成图文并茂的讲义。

结语:阿里全面押注原生多模态

随着Qwen3.6-Plus的发布,千问团队称,他们近期的工作重心将全面转向Qwen3.6系列的整体发布。在未来不久,千问还将开源更小规模的模型版本。同时,性能更强的旗舰模型Qwen3.6-Max也将很快亮相。

值得注意的是,自Qwen3.5发布后,千问已经全面将其主力模型Qwen转向了原生多模态。该团队称,他们希望模型逐步演进为一个能够在真实环境中持续感知、推理和行动的原生多模态智能体。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
微信又上线新功能,聊天突然变了!
近日,微信突然因内测“访客记录”功能,引发全网关注。被内测到的用户,..
元宝可以总结微信聊天记录了
作者 | 黄昱元宝终于拆掉了微信最高的围墙。5月13日,腾讯旗下AI原生应用..
刚刚,微信聊天记录能喂给AI了!我让它爬楼、砍价、整理信息..
智东西作者 | 陈骏达编辑 | 心缘智东西5月13日报道,今天,腾讯宣布,微..
微信聊天出新功能了,快试试!
但要求你的手机安装有元宝App,这时就会跳转到元宝中进行粘贴,你可以发..
不用登你的微信,也能看到你的聊天记录!这几个地方一定赶紧删除..
你知道吗?其实不用登你的微信,也能看到你的聊天记录,是不是太可怕了?..
刚刚,微信聊天记录能喂给AI了,我让它爬楼、砍价、整理信息..
智东西5月13日报道,今天,腾讯宣布,微信已经支持将消息一键转发至元宝..
聊天总把天聊死?这7个雷区,你可能正在踩。如何正确和女生聊天..
明明聊得火热,为什么突然被拉黑?你可能踩中了这七个聊天雷区“在吗?”..
用ChatGPT看病,80%误诊:AI医生的9秒奇迹和80%的残酷真相..
9秒出CT报告,1分钟完成心脏诊断——AI医疗看起来像魔法。但哈佛刚说完:..
突发!OpenAI高层巨震,ChatGPT与CodeX或合并,超级AI来了!..
根据《连线》5 月 15 日的独家报道,在最新一轮组织调整中,OpenAI 总裁 ..
关于作者
国务院环卫工..(普通会员)
文章
2043
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110233

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索