> 自媒体 > (AI)人工智能 > 基于GPT-3和DALL-E的漫画生成
基于GPT-3和DALL-E的漫画生成
来源:新缸中之脑
2023-05-01 19:02:25
577
管理

我花了上个月的时间探索如何使用 OpenAI 的 GPT-3 文本生成器和他们的 DALL-E 图像到文本系统来创建新的漫画,而无需编写任何源代码。 请注意,这两个系统都处于测试阶段,在我用完所有免费代币后,它们开始收取象征性的使用费。 不过效果还不错! 并且 OpenAI 授予用户将其生成的材料用于商业目的的权利。

系统显示了结果。

1. The Benchwarmers2. Intramural Idiots3. Out in Left Field4. One Hitter Wonders5. Bleacher Creatures6. The Walk-ons7. Touchdowns and Turnovers8. The Mascots9. Mark Madness10. Shot Clock Shenanigans

我喜欢“Mark Madness”,所以我用了那个。 如果它们都不好,我可以点击撤消最后一个按钮并再次提交以创建一些新的。 GPT-3 有很多想法。

请注意,生成的标题不能保证在现实世界中是唯一的。 因此,我快速进行了一次谷歌搜索,但没有找到与名为“Mark Madness”的现有漫画相关的任何搜索结果。很好。

3、使用 GPT-3 创建角色

为了为新漫画创作角色,我设计了这个提示,“为一部名为 Mark Madness 的关于大学体育的新漫画创作主角。” 并点击提交。 以下是结果,生成的文本以粗体显示。

Create lead characters for a new comic strip about college sports called "Mark Madness."1. Mark: A talented but under-appreciated college basketball player who dreams of making it to the NBA.2. Jimmy Chitwood: Mark's talented but egotistical teammate who always seems to steal the spotlight.3. Suzie Hurley: Mark's girlfriend and fellow student, who is always trying to get him to focus on his studies.4. Mr. McNulty: Mark's crusty old basketball coach who is always harping on him to "play with more passion."5. Dean Snyder: The dean of Mark's college, a highly respected academic institution that is also known for its Division I athletics.

这些角色看起来还不错。 例如,GPT3 认为主角应该是一位名叫马克的大学篮球运动员。

但请注意,角色集中似乎没有太多文化多样性。 GPT-3 的创建者在他们的论文中讨论了偏见和缺乏文化代表性的问题。

训练数据中存在的偏差可能会导致模型生成刻板印象或带有偏见的内容。 这是令人担忧的,因为模型偏见可能会通过巩固现有的刻板印象和产生贬低形象以及其他潜在危害,以不同的方式伤害相关群体中的人。 我们对模型中的偏差进行了分析,以便更好地理解 GPT-3 在公平性、偏差和代表性方面的局限性。 — Tom Brown 等人,OpenAI

他们继续讨论他们对模型中性别、种族和宗教偏见和文化代表性不足的分析。

4、使用命令编辑文本

OpenAI 在 GPT-3 中推出了一项新的文本编辑功能,目前处于测试阶段。 现在,你不仅可以通过响应提示来创建文本,还可以使用该系统使用文本命令编辑任何现有的散文。 为了测试这一点,我使用了上面的角色列表,并要求系统“让角色在文化和种族上更加多样化。”

这是结果。

1. Mark: A talented but under-appreciated college basketball player who dreams of making it to the NBA.2. Enrique: Mark's talented but egotistical teammate who always seems to steal the spotlight.3. Sandhya: Mark's girlfriend and fellow student, who is always trying to get him to focus on his studies.4. Mr. McNulty: Mark's crusty old basketball coach who is always harping on him to "play with more passion."5. Dean Wong: The dean of Mark's college, a highly respected academic institution that is also known for its Division I athletics.

好的,它改变了一些名字,比如 Jimmy 改为 Enrique,Suzie 改为 Sandhya,以使角色更加多样化。

5、创建场景

文本生成的最后一步是要求 GPT-3 在给定标题和字符的情况下创建一个场景。 这是我使用新生成的粗体文本的提示。

Create a scene with dialog for a comic strip about a college sports called "Mark Madness."CHARACTERS:Mark: A talented but under-appreciated college basketball player who dreams of making it to the NBA.Enrique: Mark's talented but egotistical teammate who always seems to steal the spotlight.Sandhya: Mark's girlfriend and fellow student, who is always trying to get him to focus on his studies.SETTING: The basketball court after a big game.Mark: Wow, we really killed it out there today!Enrique: Yeah, no thanks to you. You're lucky I was there to carry the team.

那是一段很好的对话。 接下来,我将解释我是如何使用 DALL-E 来渲染这个场景的。

6、使用 DALL-E 从文本中绘制漫画

上个月,我写了一篇关于如何使用 OpenAI 的 DALL-E 图像创作系统来创作数字艺术的文章。 这是一个付费系统,目前处于测试阶段,可在此处注册。 输入文本提示并点击生成按钮,20 秒后,你会看到提示中描述的图像的四个版本。 它非常容易使用。

7、疯狂马克

对于 Mark Madness 漫画,我使用了这个提示,“在篮球场上的漫画中有两个穿着红色制服的角色,马克,一个才华横溢的大学篮球运动员,和恩里克,一个自负的队友。” 这是 DALL-E 创建的四张图片。

总的来说,这些都很好。 但是,除了乱码之外,第三个面板中的视觉一致性也存在重大问题; DALL-E 不知道角色应该是什么样子。 根据提示,它只是尽力而为。

13、创建角色研究

为了让角色更真实,我首先在 Photoshop 中润色了图像,然后创建了一个带有 3x2 网格的模板,并在左上角渲染了 Millie。 我让六个面板中的五个保持透明。 模板的大小为 1024x1024,这是 DALL-E 的工作分辨率。

然后我将模板上传到 DALL-E 并使用提示编辑图像,“Millie 的漫画人物研究,一位才华横溢的年轻大学生和编码员,以六个不同的姿势从侧面和正面展示她。” 这是结果。

显然,DALL-E 知道什么是角色研究,并且在以不同姿势呈现我们的主角方面做得相当不错。

为了创建最终的片段面板,我选择了其中一个姿势并将其与透明背景上的 Lily 图像的一部分一起粘贴到 Photoshop 中。 我擦掉了他们脸上的一部分,看看 DALL-E 是否可以根据提示填写他们的表情,“米莉的一个技术漫画,一个大学生在她的电脑上工作,屏幕显示可怕的错误信息,她的朋友 Lily Nguyen 看着 吓坏了。” 这是结果。

该系统在细节方面做得很好,比如米莉的手在她的键盘上打字,并为她提供了双显示器设置。

这是在 Photoshop 中进行更多清理后最终的三面板漫画的样子,以及来自 GPT-3 的对话中的气泡一词。

14、最后的想法

比较这两个系统,我发现 GPT-3 在生成文本方面比 DALL-E 在艺术作品方面做得更好。 尽管漫画的初始图像作为概念渲染看起来还不错,但它们需要进行一些清理才能用于生产。 但主要问题是 DALL-E 不能为漫画连贯地生成角色。 主要限制源于 DALL-E 中的 1024x1024 图像大小。 请注意,OpenAI 最近添加了一个新的“outpainting”功能,可以更轻松地添加到生成的图像中。 但是,新功能只能以零星的方式发挥作用。 它只考虑用于图像生成的 1024x1024 帧。 该系统需要一个“上传参考帧”功能来一致地生成视觉元素,比如漫画人物。

原文链接:http://www.bimant.com/blog/gpt-comics-generation/

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
《飞驰人生》片尾为何谢王思聪?不止借车库,千万跑车全是真家伙..
提起《飞驰人生》,不少人都记得片尾字幕里王思聪的名字,却鲜少有人知道..
中国古代的顶级“超跑”,如今全球仅剩六千匹!汗血宝马是啥样?..
在历史的长河中,骏马总是与英雄、战争和传奇紧密相连,而对于我们中国人..
法拉利296 Challenge Stradale路试曝光:赛道版公路跑车即将到来..
【网通社快报】法拉利被拍到正在测试一款重度伪装的原型车,外观酷似赛道..
10款你应该现在就入手的跑车,趁它们还没成为经典款!..
整备质量马力扭矩布局2195磅138马力126磅英尺中置引擎,后轮驱动MR-S 是..
消息称保时捷下月推911 GT3 Cabriolet敞篷跑车:折叠软顶..
IT之家 2 月 24 日消息,汽车媒体 thesupercarblog 于 2 月 22 日发布博..
新能源汽车出海2.0:从“卖车”到“建生态”
文 | 惊蛰研究所,作者|芒种2007年,华语女子团体S.H.E的一首《中国话》..
汽车能“乘火车”返乡了!订单火爆→
今年春运,“12306托运汽车订单火爆”的话题冲上热搜。汽车“坐”着火车..
湖北造飞行汽车来了!单价或50万元以内,市民可以像开汽车一样开“飞车”..
极目新闻记者 黄忠 陈倩 杨绍杭 王俐燃 刘中灿像车,又像飞机,能垂直起..
紧急召回!近30万辆汽车,吉林车主快自查!
国家市场监督管理总局网站2月9日发布上海蔚来汽车有限公司的汽车召回信息..
关于作者
秋叶无痕(普通会员)
文章
1966
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103523

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索