> 自媒体 > (AI)人工智能 > MiniGPT-4,开源了
MiniGPT-4,开源了
来源:CodeSheep
2023-05-06 15:41:16
540
管理

上个月GPT-4发布时,我曾写过一篇文章分享过有关GPT-4的几个关键信息。

当时的分享就提到了GPT-4的一个重要特性,那就是多模态能力。

比如发布会上演示的,输入一幅图(手套掉下去会怎么样?)。

但是时间过去了这么久,GPT-4像这样的识图功能也迟迟没有开放。

就在大家都在等待这个功能开放的时候,一个名为MiniGPT-4的开源项目悄悄做了这件事情。

https://github.com/Vision-CAIR/MiniGPT-4

项目除了是开源的之外,而且还提供了网页版的demo,用户可以直接进去体验。

MiniGPT-4也是基于一些开源大模型来训练得到的。

团队把图像编码器与开源语言模型Vicuna(小羊驼)整合起来,并且冻结了两者的大部分参数,只需要训练很少一部分。

训练分为两个阶段。

传统预训练阶段,在4张A100上使用500万图文对,10个小时内就可以完成,此时训练出来的Vicuna已能够理解图像,但生成能力有限。

然后在第二个调优阶段再用一些小的高质量数据集进行训练。这时候的计算效率很高,单卡A100只需要7分钟。

并且团队正在准备一个更轻量级的版本,部署起来只需要23GB显存,这也就意味着未来可以在一些消费级的显卡中或许就可以进行本地训练了。

这里也给大家看几个例子。

比如丢一张食物的照片进去来获得菜谱。

或者给出一张商品的照片来让其帮忙写一篇文案。

当然也可以像之前GPT-4发布会上演示的那样,画出一个网页,让其帮忙生成代码。

可以说,GPT-4发布会上演示过的功能,MiniGPT-4基本也都有。

这一点可以说非常amazing了!

可能由于目前使用的人比较多,在MiniGPT-4网页demo上试用时会遇到排队的情况,需要在队列中等待。

但是用户也可以自行本地部署服务,过程并不复杂。

首先是下载项目&准备环境:

git clone https://github.com/Vision-CAIR/MiniGPT-4.gitcd MiniGPT-4conda env create -f environment.ymlconda activate minigpt4

然后下载预训练模型:

最后在本地启动Demo:

python demo.py --cfg-path eval_configs/minigpt4_eval.yaml

通过这个项目我们也再一次看出大模型在视觉领域的可行性,未来在图像、音频、视频等方面的应用前景应该也是非常不错的,我们可以期待一下。

好了,今天的分享就到这里了,感谢大家的收看,我们下期见。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
独家丨周博磊加入机器人初创,致力实现人行道自动驾驶技术突破..
当自动驾驶机器人行驶在城市的人行道场景,算法会有效还是失灵呢?这是一..
快手可灵AI启动Pre‑IPO融资,投前估值180亿美元
6月3日,据IPO早知道等多家媒体报道,快手(01024.HK)旗下视频生成业务..
一季度营收暴涨 320%!AI 视频破局,可灵 AI 凭啥打穿产业落地?..
最近 AI 行业终于传来实锤级消息:可灵 AI2026 年一季度营收突破 6.5 亿..
可灵AI估值超千亿 分拆独立上市 将改写AI应用估值逻辑?..
快手旗下可灵AI启动Pre-IPO轮融资的消息传开后,所有人都在讨论180亿美元..
可灵AI收入增超3倍,利润承压:快手站在十字路口
本报(chinatimes.net.cn)记者于玉金 北京报道快手来到了十字路口。5月2..
可灵AI推出全新可图2.1模型 实现多维能力跃升
来源:环球网 【环球网科技综合报道】7月10日,快手旗下可灵AI推出可图2...
AI又怎样?可灵这支短片让无数人破防
“是不是去一个很远的地方就叫去世啊?”这,是一个孩子对“死亡”的第一..
可灵3.0加入AI拜年战场!人在工位搓好莱坞大片,分镜逻辑封神..
梦瑶 发自 凹非寺量子位 | 公众号 QbitAI不是,谁也没跟我说今年的AI春节..
可灵温园旭:AI的终极使命不是取代创作,而是让更多人拥有表达的能力..
封面新闻记者 吴雨佳随着模型能力的持续突破,AI视频生成正从“工具属性..
关于作者
加勒比海盗..(普通会员)
文章
2082
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113743

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索