> 自媒体 > (AI)人工智能 > 视觉理解模型Qwen3-VL发布,32项评测超过Gemini2.5-Pro和GPT5
视觉理解模型Qwen3-VL发布,32项评测超过Gemini2.5-Pro和GPT5
来源:迈步2000
2025-10-01 13:14:58
82
管理

9月24日的2025云栖大会上,阿里开源新一代视觉理解模型Qwen3-VL。该模型在视觉感知和多模态推理方面实现重大突破,在32项核心能力测评中超过Gemini2.5-Pro和GPT-5。同时,Qwen3-VL大幅提升了视觉Agent、视觉编程和空间感知等关键能力,不但可调用抠图、搜索等工具完成“带图推理”,也可以凭借一张设计草图或一段小游戏视频直接“视觉编程”,“所见即所得”地复刻图表、网页和复杂程序。

Qwen3-VL-235B-A22 Instruct测评分数

本次开源的是旗舰版Qwen3-VL-235B-A22B,有开源指令(Instruct)模型和推理(Thinking)模型两大版本。Qwen3-VL展现了在复杂视觉任务中的强大泛化能力与综合性能,在逻辑谜题、通用视觉问答、多语言文本识别与图表文档解析、二维与三维目标定位、具身与空间感知、视频理解等32项具体测评中,指令版Qwen3-VL超越了Gemini2.5-Pro 和 GPT5 等闭源模型,同时刷新了开源多模态模型的最佳成绩。推理版Qwen3-VL多模态思考能力显著增强,在 MathVision、MMMU、MathVista 等权威评测中达到领先水平。

Qwen3-VL拥有极强的视觉智能体和视觉Coding能力,几乎刷新所有相关评测的最佳性能。Qwen3-VL 不仅能看懂图片,还能像人一样操作手机和电脑,自动完成许多日常任务,例如打开应用、点击按钮、填写信息等,实现智能化的交互与自动化操作。输入一张图片,Qwen3-VL可自行调用Agent工具放大图片细节,通过更仔细的观察分析,推理出更好的答案;看到一张设计图,Qwen3-VL 就能生成Draw.io/HTML/CSS/JS 代码,“所见即所得”地完成视觉编程,真正推动大模型从“识别”迈向“推理与执行”。

Qwen3-VL可支持扩展百万tokens上下文,视频理解时长扩展到2小时以上。这意味着,无论是几百页的技术文档、整本教材,还是长达数小时的会议录像或教学视频,都能完整输入、全程记忆、精准检索。Qwen3-VL还能根据时间戳精确定位“什么时候发生了什么”,比如“第15分钟穿红衣服的人做了什么”、“球从哪个方向飞入画面”等,都能准确回答。

Qwen3-VL的3D检测能力增强,未来可协助机器人等具身智能判断物体的方位

大模型的空间理解能力是实现具身智能的基础,Qwen3-VL 专门增强了3D检测(grounding)能力,可以更好地感知空间。当前,机器人想要轻松抓住桌上的一个苹果,并不容易。凭借Qwen3-VL强大的3D检测能力,未来可让机器人更好地判断物体方位、视角变化和遮挡关系,从而准确判断苹果的位置与自身距离,实现精准抓取。

据了解,千问视觉理解模型已实现广泛落地,比如国家天文台联合阿里云发布的全球首个太阳大模型“金乌”,正是基于 Qwen-VL 等模型以超过 90 万张太阳卫星图像为样本完成微调训练。未来,Qwen3-VL模型还将开源更多尺寸版本。即日起,用户可在通义千问QwenChat上免费体验Qwen3-VL,也可通过阿里云百炼平台调用API服务。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
DeepSeek 为啥敢换华为芯片?AI 芯片四大玩家都有谁?
4月24日,国产AI圈发生了一件大事:DeepSeek 正式发布 V4 双版本大模型,..
DeepSeek V4来了:1.6万亿参数、百万上下文,还有几个细节值得看..
DeepSeek V4 预览版正式发布并开源了。这次更新不只是简单的“能力更强”..
太扎心!DeepSeek V4登顶,焊死国产软硬链路,但现实鸿沟仍难跨..
最近DeepSeek V4彻底刷爆科技圈与投资圈,公开跑分追平甚至部分超越GPT-4..
DeepSeek “去英伟达化”,黄仁勋最担心的事来了
盼星星盼月亮,DeepSeek的新模型终于来了。这次发布的是V4版本,一出来网..
DeepSeek V4 发布,国产芯片替代,美国会怕了吗?
4 月 24 号 DeepSeek V4 正式出了,这次挺不一样的,直接说能适配华为芯..
DeepSeek V4 炸场!100 万 token + 开源,比 GPT 便宜 200 倍
2026 年 4 月 24 日,国产大模型迎来历史性时刻:DeepSeek 正式发布 V4 ..
美西方真慌了!中国DeepSeek V4尺度拉满:百万上下文 + 双版本开源..
#DeepSeekV4 尺度# 震撼发布!4 月 24 日,深度求索正式推出 DeepSeek V4..
首发被华为抢了!英伟达急眼:当天火速官宣适配DeepSeek V4..
来源:市场资讯(来源:快科技)快科技4月25日消息,DeepSeek V4正式发布..
事关家家户户!DeepSeek V4全面开源,咱们普通人好处实打实..
事关每个人的生活变化,最近很多人问,今天DeepSeek V4一发布就开源这件..
关于作者
呼唤(普通会员)
文章
1916
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105648

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索