——"一片向日葵花海在星空下闪烁。"
本来只是在有限的想象力之内挑了梵高的两幅名画加以简单概括,结果AI吞掉这句描述后,居然就吐出了一张张极富冲击力的图像:

图源:Simon_阿文 微博
没有参考图像,也并非简单的两幅图像的拼接融合,而是真正基于文字描述,在充分的想象力下,从无到有地进行了绘画创作。
而就在不到一年的时间内,这样的AI画手开始井喷式地出现——
近期在海内外爆火的免费AI作画工具Disco Diffusion,输入简单的文字描述就能在线生成图像,其画面之精细,想象力之超绝让不少人直呼“AI比我都浪漫”:

图源:开发者推特
一度登上苹果应用商店的图形与设计排行榜榜首的Wombo,只要下载App,上传图片或输入关键词,再选择平台给予的风格,几秒之后就能生成图片,其超绝的想象力被无数用户玩出了花:

文字描述拥有画种描述、内容描述、画家描述、参考渲染方式、颜色描述五个维度,用户不用修改代码,而是只要从这几个方面进行调整和修改,就可以生成图像。
不过,鉴于是初玩,阿文只谨慎地修改了默认文本中的两个关键词:A beautiful painting of a starry night(原singular lighthouse), shining its light across asunflower sea(原tumultuous sea)by greg rutkowski and thomas kinkade, Trending on artstation.” "yellow color scheme“,也就是将默认的”一座在惊涛骇浪中闪耀的奇异灯塔”改成了“一片在星空下闪耀的向日葵花海”。
而AI吐出的第一张图片是这样的:

图源:Simon_阿文 微博
简单的文字描述外加一点点天赐般的运气,诞生了数张色彩构图丰富大胆,如同梦境般的画作,最终一举出圈,在微博超过两万人转发,并纷纷表示震惊“给跪”。
也因此,大批用户纷纷涌入,开启了脑洞大开的AI花式作画。
有将参考画师改为吴冠中,直接得到一张水墨画:

图源:Simon_阿文 微博
“就像是一个听话版的Disco Diffusion。”阿文笑道。
在尝试多次后,他觉得Midjourney的想象力是比不上Disco Diffusion的,但好处是速度够快,五分钟就能成图,而且不至于像Disco Diffusion那样,有抢夺创作主导权的“野心”,是更适合艺术创作者的辅助工具。
还有更多像阿文这样的艺术创作者,走上了探索AI绘画工具的道路,并开始逐步挖掘各自的潜力。
比如主阵地是移动端的Dream,它的整体作画风格更偏向于梦幻柔和:

图源:网络
而诸如DALL·E2、Imagen之类的画手,则是在如何更准确地理解文字描述、更好地组合绘画风格,最后生成更精确而言之有物的事物和人物的方向努力。
当然,除了这些从无到有的“高端创作者”,近几年也火过一批更加亲民的AI画手们。
比如在去年一度火爆外网AnimeGAN,可以实时地将人像转为漫画模样,也是在线部署,火到要排队几个小时才能玩到:

图源:网络
去年在日推被疯转的AI,简陋的草图一经它手就会变成精致可爱的二次元萌妹:

图源:论文
就像人类拥有五感一样,AI也有自己听觉和视觉,也就是AI研究者们划分出来的计算机视觉(Computer Vision,简称CV)、自然语言处理(Natural Language Processing,简称NLP)、语音识别(Automatic Speech Recognition,简称ASR)等研究领域。
而文本生成图像,则是将计算机视觉的自然语言处理两种领域连接了起来,也被称为多模态学习(MultiModal Learning),可以说,这种技术是今天AI绘画的重要基础。
但要让AI学会”通感“,难度也可想而知,一开始,AI只能在受限的数据集内取得成果,得到的分辨率也不高,同时,AI也受限于机器对于人类自然语言的理解,因此,文本生成图像的进展并不迅速。
直到2021年1月5日,DALL·E模型横空出世。

图源:OpenAI官网 穿着芭蕾裙遛狗的小白萝卜插画
能将某些对象或概念合并至单个图像中:

图源:网络
这也是AI绘画广为人诟病的另一点:在具象内容,尤其是人物生成上的能力偏弱。看似冲击力十足却缺乏逻辑和细节的画面,没有哦内核的概念拼凑......还有更多问题,都使得AI作画不可能百分之百地展现完美的效果。

图源:网络 wombo生成的没有意义的色块拼接
因此,至少对现在的AI绘画工具来说,人类画手后期的调整和加工必不可少。
并且,技术较为前沿,且需要一定艺术知识的AI作画工具,最先接触与最熟悉的第一批用户,一定也都是画手和设计师,即产业中的乙方。而且越到后期,AI工具就越需要关键词输入之外的更多知识,比如具体到代码层面的参数调整。因此,即使是走到了产业化的一步,甲方首先接触到的,也更有可能是”会使用AI的乙方“,而并非AI本身。
作为”会使用AI的乙方“的阿文,还提出了另一种观点:
AI绘画的出现,反倒会让很多画手有了新的契机,能够借助AI工具成为高端画师。
画工、想象力、底图、灵感......诸多不足都可以由AI绘画工具来补足,只要在这些图的基础上进行二次创作,就很有可能够到更高的门槛。
阿文现在就在努力将AI绘画工具纳入自己的工作流程中,比如他在微博就展示过这么一个例子:首先用Disco Diffusion生成相应的纹理,然后再到三维建模工具blender里贴图,最后再搭场景:

图源:Simon_阿文 微博
至于版权问题,阿文表示,AI作画工具在使用时,确实有通过描述词进行了“画风抄袭”的可能性,因此他建议,尽量使用已经过世的艺术家的风格,如果使用了某位风格鲜明的当代艺术家作为关键词,或者使用了某部商业作品作为参考画作时,还是尽量避免商用。
不过他也提到,比如Disco Diffusion并不是所谓的描图、素材拼接或组装,而是依据技术框架对图像进行了规律和技法的提炼,然后再进行模仿,所以“画风抄袭”的风险不是很大。
另外,Disco Diffusion现在的所有代码已经开源,且遵循MIT开源协议,也就是别人可以进行闭源修改代码,且无须经过版权说明,就能复制甚至销售衍生的产物:

图源:阮一峰博客
至于一些二次元头像生成器,阿文则开玩笑地表示“技术不到家,抄得还不够像”,因此甚至都到不了“画风抄袭”的地步。
···
然而,上述解答依旧不能让所有人安下心来。
在更深层次的思考中,有人担心AI是否会杀死绘画的意义,就像当年的摄影技术之于写实绘画,或者像今天的AI之于围棋。
摄影技术诞生于两百年之前,一经应用便迅速取代了绘画的记录留影功能,一度使得诸多传统画家认为绘画将在摄影技术下的逼迫下逐渐消亡。
而AI进入围棋则始于2014年的AlphaGo,在人工智能那几乎是无法超越的计算能力下,多国的围棋黑马和明宿皆被一一斩于马下。
“但是摄影之于绘画艺术,其实并没有严重到‘摧毁’的地步。”
阿文解释道。
当时的绘画看似在摄影的“逼迫”下失去了其实用价值,转为了纯粹的艺术领域,但实际上,摄影在视觉经验上的真实性,使得很多画家开始更多地关注绘画本身的特质,试图以绘画对现实乃至精神世界进行更丰富的演绎,后印象派、野兽派等新兴流派就是因此得而诞生。
而到了今天,摄影不仅有最实用的记录功能,自身也是一门独立的艺术学科,有着构图和色彩领域的只是体系;而绘画在艺术性不失的同时,留影功能也开始逐渐复苏,甚至因为其独特的笔触带来了更多美的享受。
而类比到AI绘画上来也一样,这无疑是对于现在绘画的一种冲击,但新老技术之间并非你死我活的竞争关系,而是相互融合,共同进化发展的一种趋势。
那么AI围棋的到来呢?
柯洁曾评价AI时代的围棋为“无聊透顶,使人类棋手丧失了存在的意义”,在诸多的AI大战人类棋手,AI预测围棋胜率的事件中,已经有观众开始对这种戏码失去兴趣:
图源:网络
因此,有不少人便也觉得,AI绘画会像AI围棋一样,逐步杀死绘画的意义。
一位画师在谈论这一话题时,表达了如下观点:
“我觉得艺术创作很多时候是基于艺术家较独一无二的性格、境遇、或者一闪而过的某种激情,是为了抒发自我,表达内心的感情而存在的。但AI只是基于图像库去分析并重组,并没有任何目的和情绪,所以实在难以称得上是‘具有灵魂’。”
但具有灵魂,产生共鸣,一定是要了解作者背后的情绪吗?
阿文举了一个这样的例子:当你走进一个美术馆,看到一幅画,然后被打动了,很多时候你可能不知道背后的作者是谁,要抒发什么样的感情,但有些画作就是能在观众看见的瞬间,便与其产生共鸣,而观众能产生这样的感受,这幅画作就是有意义的。
而当我们再回过头,去看那张出圈的“星空下的向日葵海”,到这里,我们已经完全知道了这幅画作创作的全过程,及其中的技术细节,也知道AI在创作这幅画的时候是不具有任何,或者说类似人类画家那样的情绪。
但翻开这幅作品的评论和转发,即使知道这是AI,依然觉得“充满意境”“浪漫无比”“有被感动到”的评论数不胜数。
“就像是AI在赛博朋克时代梦到了梵高。”

AI绘画背后的技术仍在快速迭代,产出的画作越来越多,而关于其产出作品有无意义的争论,在可预见的未来仍将继续。
AI绘画的终点是什么?是成为人类画手最完美的绘画辅助者,还是一步一步补足其逻辑性、想象力、创造力,成为一名真正可以与人类并肩的画手?
我们现在也只能站在星空下的向日葵海中,静静等待那个答案的到来了。采写:南都见习记者杨博雯
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体111950