视频模型的 GPT-3 时刻：谷歌 Veo 3 正在重新定义计算机视觉-工信会

> 自媒体 > （AI）人工智能 > 视频模型的 GPT-3 时刻：谷歌 Veo 3 正在重新定义计算机视觉

视频模型的 GPT-3 时刻：谷歌 Veo 3 正在重新定义计算机视觉

来源：亲切孔雀dj

2025-10-03 12:17:28

98

管理

“把绿幕撤了，它居然就不会抠像了。

r

r

有人拿自家客厅白墙当背景，一句“把沙发换成太空舱”，Veo 3r直接把墙皮啃掉一半；换成绿幕再试，边缘干净得像手擦过玻璃。

r

谷歌没宣传这个彩蛋，却意外泄露了天机：我们以为的“AIr视觉大神”，其实还偷偷背着颜色作弊器。

r

先别急着笑它“色弱”。

r

同一批内测片里，有人随手拍了一段地铁车厢，一句“擦掉对面乘客的手机”，手机瞬间被空气吃掉，连手指缝里的反光都补得毫无rPS 痕迹。

r

专业剪辑师看完沉默：这套操作放到 DaVincir里至少半小时，现在一句话搞定，调色层还自带机内风格 LUT。

r

Adobe 已经放话，明年 Q1 把同款接口塞进rPremiere，价格按订阅费摊平，四舍五入等于白送。

r

r

影视后期圈瞬间分裂成两派：一边连夜下单r4090，一边在群里哀嚎“日子到头了”。

r

更离谱的是实验室跑分。

r

YOLOv8 啃了八年数据才爬到 82 分，Veo 3r用五分之一的瘦身体重，零样本就摸到r78.3——相当于考前没翻书，压轴大题只写个“解”就差点满分。

r

秘诀藏在论文第 17r页一行小字：时空注意力模块让模型自己给自己“划重点”，把前一帧猜错的像素当成下一帧的反面教材，边播边学，一路小跑追上老司机。

r

三个月前它走迷宫还像醉汉，如今 78%r一次通关，进步曲线陡峭得让投资人眼晕。

r

但别被数字冲昏头。

r

r

有人拿自家猫试“跳上冰箱”任务，Veo 3r把猫变成液体才挤上去，物理定律当场碎成渣。

r

计算账单更劝退：一段 1080p 十秒剪辑，云端跑一趟烧掉 2.8 美元，剪个rvlog 比买杯手冲还贵。

r

prompt 更是娇贵，多一个“the”少一个“a”，背景能把人抠成透明。

r

朋友吐槽：这哪是 AI，分明是甲方投胎——得哄。

r

可就在骂声里，变化已经悄悄发生。

r

Pixelr用户把“一键抹除前任”玩成社交梗，短视频平台瞬间多出几十万条“灵异前任消失术”；小剧组用rVeo 3r预演炸车戏，实拍前就把机位、穿帮点摸得清清楚楚，火药少买一半，保险公司笑到合不拢嘴。

r

r

技术还没完美，却先让“拍得起”的人变多，故事先一步跑起来——历史反复证明，当工具降到傻瓜级，内容才会真正爆炸。

r

至于绿幕偏见，其实像一面镜子：我们总希望 AIr像人，却忘了它只是统计的奴隶。

r

给它绿幕最多，它就最懂绿幕；给它真实世界的杂乱，它一样会长大。

r

真正的“GPT-3r时刻”不是分数破表，而是当哪天你忘了它曾经叫“Veo”，只记得打开相机就能让想象落地——那一刻，视觉的母语被改写，人人都是导演，而绿幕只是过渡的注脚。

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

视频模型的 GPT-3 时刻：谷歌 Veo 3 正在重新

视频模型的 GPT-3 时刻：谷歌 Veo 3 正在重新

相关文章

NeurIPS 2025放榜：阿里Qwen门控注意力获最佳论文

嘻疯发自凹非寺量子位 | 公众号 QbitAI刚刚，NeurIPS 2025最佳论文奖、..

阿里千问开源4款Qwen3.5小尺寸模型，满足资源受限至轻量应用不同需求..

【太平洋科技快讯】3月3日消息，阿里千问近日开源四款Qwen3.5更小尺寸模..

实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%..

它用时四分钟左右，写完了1200多行代码。从实测结果来看，游戏设计与前端..

阿里亲身入局具身智能！Qwen内部组团，通义千问技术负责人带队..

衡宇发自凹非寺量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具..

Qwen紧追OpenAI开源4B端侧大模型，AIME25得分超越Claude 4 Opus..

衡宇发自凹非寺量子位 | 公众号 QbitAI三天不开源，Qwen团队手就痒。昨..

Qwen又立功，全球最快开源模型诞生，超2000 tokens/秒

全球最快的开源大模型来了——速度达到了每秒2000个tokens！虽然只有320..

激活170亿参数 Qwen3.5实测重构大模型性价比逻辑

2月16日Qwen3.5正式开源，以3970亿总参数、仅170亿激活参数的架构实现性..

Qwen最新闭源模型曝光！实测夸克“对话助手”

10月23日，阿里旗下夸克正式上线“对话助手”。从界面上看，它像是“塞进..

林俊旸离职后，Qwen的变与不变

来源：视觉中国OpenAI早期也曾采用垂直整合的架构模式，并集中资源完成了..

关于作者

卿嫣(普通会员)

文章

1937

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索