> 自媒体 > (AI)人工智能 > 从OpenAI VPT,看视频预训练
从OpenAI VPT,看视频预训练
来源:大数据文摘
2023-08-17 16:35:45
738
管理

由于RL收敛比较慢,作者也采用了不少方法加速训练,其中很重要的一点是Self-Imitation Learning,直接把拿到高奖励的动作序列保存下来去学习,就像SFT一样去学习,效果提升很明显(红色线):

得到视频预训练模型之后,对于特定的任务,可以直接利用人工标注数据进行精调,同时可以再进行RL,作者发现Pretrain SFT RL三步之后效果奇佳,模型可以完成非常复杂的任务(人类需要20分钟才能完成)。

同时,VPT也尝试了加入字幕、音频转文字后的数据进行多模态训练,但由于数据太少,只展现了微弱的可控性,不过当下再来看文本可控并不是难点,已经有很多成功的工作了。

看完VPT,再来对比一下MineDojo,可以发现LLM范式一个明显的优点,即提升了训练效率和效果天花板,因为纯RL要靠自己探索,其实收敛的很慢,而且有些复杂的任务需要很长的链路,纯RL可能根本探索不到。

通用视频预训练?

虽然VPT证明了LLM的范式在视频预训练同样可行,但个人认为还有两个比较关键的问题:

图像与文本的预训练数据不兼容:目前互联网的语料都是图像或者文字一方占主导,所以后续大概率是和现在一样,两种模态分别预训练,再通过少量数据融合。

VPT的方法不够通用:像NLP一样进行通用领域的视频预训练还有很长的路要走。首先VPT在准备训练语料时,需要定义标签的动作空间,目前只局限在鼠标和键盘,但真实世界中的动作太多了;另外很多领域的监督数据也不一定好获取,比如需要真人出镜的视频成本会很高。

VPT这篇工作在去年推出时并没有引起太大火花,如今想一想,虽然存在上述问题,但在一些垂类场景上已经有落地的可能了,比如在excel上做数据分析、做PPT、操作photoshop等。

再一想,OpenAI居然前年就开始做这些事儿了,真可怕。

参考资料

[1]Video-Pre-Training: https://cdn.openai.com/vpt/Paper.pdf

[2]MineDojo: https://minedojo.org/

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
打造全球最强劲超级跑车的十大汽车制造商
对极致动力的追求一直是超级跑车世界的核心。虽然造型、空气动力学和操控..
奥迪确认下一代TT电动跑车仍按计划推进,与保时捷718 EV平台共享..
【网通社快报】尽管保时捷纯电718项目前途未卜,奥迪CEO高德诺近日明确表..
高性能不值钱的电动化时代,超跑如何自我证明?
静谧却势不可挡的电动化浪潮,席卷了整个汽车市场。这是一个告别燃烧汽油..
保时捷纯电718需求不及预期,豪华纯电跑车市场遇冷了吗?..
豪华纯电跑车市场并未整体遇冷,保时捷纯电718的需求问题更多是品牌自身..
优雅的意式跑车,搭载V8双增压动力,功率640马力,加速3.3s..
在众多超级跑车制造商中,意大利汽车品牌绝对是不容被忽视的。这个领土面..
《Motor Trend》实测兰博基尼Temerario:只有两款油车比它快..
IT之家 2 月 7 日消息,美国老牌汽车杂志《Motor Trend》对兰博基尼全新..
法拉利纯电超跑Luce路测图曝光:1000马力,五月首秀
IT之家 2 月 19 日消息,汽车媒体 CarScoops 昨日(2 月 18 日)发布博文..
跑车女皇法拉利F80 即将发布,售价接近3000万
在高性能跑车领域,法拉利、保时捷和玛莎拉蒂是当之无愧的超级选手,随随..
设计公司Italdesign“复活”本田经典跑车NSX,致敬两代经典设计..
IT之家 1 月 10 日消息,当地时间 1 月 9 日,据外媒 Autocar 报道,意大..
关于作者
帝王之星(普通会员)
文章
1930
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107690

1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索