谷歌微软争相研究AI绘画：机器想象力逼近人类，可十秒作画-工信会

> 自媒体 > （AI）人工智能 > 谷歌微软争相研究AI绘画：机器想象力逼近人类，可十秒作画

谷歌微软争相研究AI绘画：机器想象力逼近人类，可十秒作画

来源：南方都市报

2026-06-01 22:09:32

129

管理

——"一片向日葵花海在星空下闪烁。"

本来只是在有限的想象力之内挑了梵高的两幅名画加以简单概括，结果AI吞掉这句描述后，居然就吐出了一张张极富冲击力的图像：

图源：Simon_阿文微博

没有参考图像，也并非简单的两幅图像的拼接融合，而是真正基于文字描述，在充分的想象力下，从无到有地进行了绘画创作。

而就在不到一年的时间内，这样的AI画手开始井喷式地出现——

近期在海内外爆火的免费AI作画工具Disco Diffusion，输入简单的文字描述就能在线生成图像，其画面之精细，想象力之超绝让不少人直呼“AI比我都浪漫”：

图源：开发者推特

一度登上苹果应用商店的图形与设计排行榜榜首的Wombo，只要下载App，上传图片或输入关键词，再选择平台给予的风格，几秒之后就能生成图片，其超绝的想象力被无数用户玩出了花：

文字描述拥有画种描述、内容描述、画家描述、参考渲染方式、颜色描述五个维度，用户不用修改代码，而是只要从这几个方面进行调整和修改，就可以生成图像。

不过，鉴于是初玩，阿文只谨慎地修改了默认文本中的两个关键词：A beautiful painting of a starry night（原singular lighthouse）, shining its light across asunflower sea（原tumultuous sea）by greg rutkowski and thomas kinkade, Trending on artstation.” "yellow color scheme“，也就是将默认的”一座在惊涛骇浪中闪耀的奇异灯塔”改成了“一片在星空下闪耀的向日葵花海”。

而AI吐出的第一张图片是这样的：

图源：Simon_阿文微博

简单的文字描述外加一点点天赐般的运气，诞生了数张色彩构图丰富大胆，如同梦境般的画作，最终一举出圈，在微博超过两万人转发，并纷纷表示震惊“给跪”。

也因此，大批用户纷纷涌入，开启了脑洞大开的AI花式作画。

有将参考画师改为吴冠中，直接得到一张水墨画：

图源：Simon_阿文微博

“就像是一个听话版的Disco Diffusion。”阿文笑道。

在尝试多次后，他觉得Midjourney的想象力是比不上Disco Diffusion的，但好处是速度够快，五分钟就能成图，而且不至于像Disco Diffusion那样，有抢夺创作主导权的“野心”，是更适合艺术创作者的辅助工具。

还有更多像阿文这样的艺术创作者，走上了探索AI绘画工具的道路，并开始逐步挖掘各自的潜力。

比如主阵地是移动端的Dream，它的整体作画风格更偏向于梦幻柔和：

图源：网络

而诸如DALL·E2、Imagen之类的画手，则是在如何更准确地理解文字描述、更好地组合绘画风格，最后生成更精确而言之有物的事物和人物的方向努力。

当然，除了这些从无到有的“高端创作者”，近几年也火过一批更加亲民的AI画手们。

比如在去年一度火爆外网AnimeGAN，可以实时地将人像转为漫画模样，也是在线部署，火到要排队几个小时才能玩到：

图源：网络

去年在日推被疯转的AI，简陋的草图一经它手就会变成精致可爱的二次元萌妹：

图源：论文

就像人类拥有五感一样，AI也有自己听觉和视觉，也就是AI研究者们划分出来的计算机视觉（Computer Vision，简称CV）、自然语言处理（Natural Language Processing，简称NLP）、语音识别（Automatic Speech Recognition，简称ASR）等研究领域。

而文本生成图像，则是将计算机视觉的自然语言处理两种领域连接了起来，也被称为多模态学习（MultiModal Learning），可以说，这种技术是今天AI绘画的重要基础。

但要让AI学会”通感“，难度也可想而知，一开始，AI只能在受限的数据集内取得成果，得到的分辨率也不高，同时，AI也受限于机器对于人类自然语言的理解，因此，文本生成图像的进展并不迅速。

直到2021年1月5日，DALL·E模型横空出世。

图源：OpenAI官网穿着芭蕾裙遛狗的小白萝卜插画

能将某些对象或概念合并至单个图像中：

图源：网络

这也是AI绘画广为人诟病的另一点：在具象内容，尤其是人物生成上的能力偏弱。看似冲击力十足却缺乏逻辑和细节的画面，没有哦内核的概念拼凑......还有更多问题，都使得AI作画不可能百分之百地展现完美的效果。

图源：网络 wombo生成的没有意义的色块拼接

因此，至少对现在的AI绘画工具来说，人类画手后期的调整和加工必不可少。

并且，技术较为前沿，且需要一定艺术知识的AI作画工具，最先接触与最熟悉的第一批用户，一定也都是画手和设计师，即产业中的乙方。而且越到后期，AI工具就越需要关键词输入之外的更多知识，比如具体到代码层面的参数调整。因此，即使是走到了产业化的一步，甲方首先接触到的，也更有可能是”会使用AI的乙方“，而并非AI本身。

作为”会使用AI的乙方“的阿文，还提出了另一种观点：

AI绘画的出现，反倒会让很多画手有了新的契机，能够借助AI工具成为高端画师。

画工、想象力、底图、灵感......诸多不足都可以由AI绘画工具来补足，只要在这些图的基础上进行二次创作，就很有可能够到更高的门槛。

阿文现在就在努力将AI绘画工具纳入自己的工作流程中，比如他在微博就展示过这么一个例子：首先用Disco Diffusion生成相应的纹理，然后再到三维建模工具blender里贴图，最后再搭场景：

图源：Simon_阿文微博

至于版权问题，阿文表示，AI作画工具在使用时，确实有通过描述词进行了“画风抄袭”的可能性，因此他建议，尽量使用已经过世的艺术家的风格，如果使用了某位风格鲜明的当代艺术家作为关键词，或者使用了某部商业作品作为参考画作时，还是尽量避免商用。

不过他也提到，比如Disco Diffusion并不是所谓的描图、素材拼接或组装，而是依据技术框架对图像进行了规律和技法的提炼，然后再进行模仿，所以“画风抄袭”的风险不是很大。

另外，Disco Diffusion现在的所有代码已经开源，且遵循MIT开源协议，也就是别人可以进行闭源修改代码，且无须经过版权说明，就能复制甚至销售衍生的产物：

图源：阮一峰博客

至于一些二次元头像生成器，阿文则开玩笑地表示“技术不到家，抄得还不够像”，因此甚至都到不了“画风抄袭”的地步。

···

然而，上述解答依旧不能让所有人安下心来。

在更深层次的思考中，有人担心AI是否会杀死绘画的意义，就像当年的摄影技术之于写实绘画，或者像今天的AI之于围棋。

摄影技术诞生于两百年之前，一经应用便迅速取代了绘画的记录留影功能，一度使得诸多传统画家认为绘画将在摄影技术下的逼迫下逐渐消亡。

而AI进入围棋则始于2014年的AlphaGo，在人工智能那几乎是无法超越的计算能力下，多国的围棋黑马和明宿皆被一一斩于马下。

“但是摄影之于绘画艺术，其实并没有严重到‘摧毁’的地步。”

阿文解释道。

当时的绘画看似在摄影的“逼迫”下失去了其实用价值，转为了纯粹的艺术领域，但实际上，摄影在视觉经验上的真实性，使得很多画家开始更多地关注绘画本身的特质，试图以绘画对现实乃至精神世界进行更丰富的演绎，后印象派、野兽派等新兴流派就是因此得而诞生。

而到了今天，摄影不仅有最实用的记录功能，自身也是一门独立的艺术学科，有着构图和色彩领域的只是体系；而绘画在艺术性不失的同时，留影功能也开始逐渐复苏，甚至因为其独特的笔触带来了更多美的享受。

而类比到AI绘画上来也一样，这无疑是对于现在绘画的一种冲击，但新老技术之间并非你死我活的竞争关系，而是相互融合，共同进化发展的一种趋势。

那么AI围棋的到来呢？

柯洁曾评价AI时代的围棋为“无聊透顶，使人类棋手丧失了存在的意义”，在诸多的AI大战人类棋手，AI预测围棋胜率的事件中，已经有观众开始对这种戏码失去兴趣：

图源：网络

因此，有不少人便也觉得，AI绘画会像AI围棋一样，逐步杀死绘画的意义。

一位画师在谈论这一话题时，表达了如下观点：

“我觉得艺术创作很多时候是基于艺术家较独一无二的性格、境遇、或者一闪而过的某种激情，是为了抒发自我，表达内心的感情而存在的。但AI只是基于图像库去分析并重组，并没有任何目的和情绪，所以实在难以称得上是‘具有灵魂’。”

但具有灵魂，产生共鸣，一定是要了解作者背后的情绪吗？

阿文举了一个这样的例子：当你走进一个美术馆，看到一幅画，然后被打动了，很多时候你可能不知道背后的作者是谁，要抒发什么样的感情，但有些画作就是能在观众看见的瞬间，便与其产生共鸣，而观众能产生这样的感受，这幅画作就是有意义的。

而当我们再回过头，去看那张出圈的“星空下的向日葵海”，到这里，我们已经完全知道了这幅画作创作的全过程，及其中的技术细节，也知道AI在创作这幅画的时候是不具有任何，或者说类似人类画家那样的情绪。

但翻开这幅作品的评论和转发，即使知道这是AI，依然觉得“充满意境”“浪漫无比”“有被感动到”的评论数不胜数。

“就像是AI在赛博朋克时代梦到了梵高。”

AI绘画背后的技术仍在快速迭代，产出的画作越来越多，而关于其产出作品有无意义的争论，在可预见的未来仍将继续。

AI绘画的终点是什么？是成为人类画手最完美的绘画辅助者，还是一步一步补足其逻辑性、想象力、创造力，成为一名真正可以与人类并肩的画手？

我们现在也只能站在星空下的向日葵海中，静静等待那个答案的到来了。采写：南都见习记者杨博雯

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

清华系硬核AI，智谱赴港冲刺“大模型第一股”

1个月前

AI玩具陪伴赛道爆发：五年规模从290亿冲击千亿，存技术监管隐忧

1个月前