还在熬夜做图的设计师们,这下真的有些尴尬了:在几乎没有预告的情况下,OpenAI 于北京时间 2026 年 4 月 22 日凌晨发布了 ChatGPT Images 2.0 模型(下文简称 Images 2.0)。
和 ChatGPT 原本的生图模型相比,Images 2.0 在图片精度、语言支持、分辨率支持和交互方式上都有着相当显著的提升。值得一提的是,这次发布的 Images 2.0 甚至还拥有了思考的能力。

除了基于图片生成新的图片,Images 2.0 基于文字做图的能力也有所提升。雷科技只给出了「电车通马上要出发报道 2026 北京车展」的信息,Images 2.0 就能自己找齐相关信息,并正确输出海报。

图片来源:雷科技
其实从效果来看,Images 2.0 的多语言支持已经非常出色了。但为了拉开能力差距,雷科技决定给 Images 2.0 上点强度:
生成一个照片风格图片:一幅毛笔书法作品在博物馆展出,上书: 北国风光,千里冰封,万里雪飘。望长城内外,惟余莽莽;大河上下,顿失滔滔。山舞银蛇,原驰蜡象,欲与天公试比高。须晴日,看红装素裹,分外妖娆。 江山如此多娇,引无数英雄竞折腰。惜秦皇汉武,略输文采;唐宗宋祖,稍逊风骚。一代天骄,成吉思汗,只识弯弓射大雕。俱往矣,数风流人物,还看今朝。
尽管文本内容更长,不过 ChatGPT 仍在一分钟之内就输出了结果。可以看出,Images 2.0 的中文支持确实不错,字体字形基本没有问题,但书法的「质感」仍有欠缺,怎么看都像是「印刷品」。

图片来源:雷科技
说完 Instant Model,我们再来看看思考模式的能力。这次雷科技直接给 Images 2.0 准备了一道大题:





图片来源:OpenAI

图片来源:OpenAI
也正因 Images 2.0 制图效果如此出色,雷科技认为 Images 2.0 的登场,也标志着 AI 生图正式告别了那个靠玄学提示词「抽卡」的蛮荒时代。
如果大家有玩过 Stable Diffusion 等早期文生图 AI,应该对文生图的「蛮荒时代」有印象:你可能第一次尝试就做出了自己想要的图片,也可能来来回回调整提示词,用两个小时生成了几百 GB 的废片,体验甚至比二次元「抽卡手游」还要差——二游至少有保底机制。
在当时,我们如果想要保证图片「有较大概率符合要求」,就必须用 ComfyUI;而 ComfyUI 复杂的节点设计,从某种意义上也违背了 AI 生图「偷懒」的目标。
但 Images 2.0 引入「思考模型」后,AI 第一次具备了长文本逻辑解析与时空一致性的推理能力。
以刚刚提到的画漫画工作流为例,Images 2.0 可以先理解场景、构思剧情、布局文字,最后再落笔。这种从底层逻辑出发的进化,直接解决了 AI 绘画中「文字崩坏」与「画风不统一」这两大问题,极大地拓宽了 AI 的生产力边界。

图片来源:OpenAI
可以肯定的是,Images 2.0 的出现,对于绘画、摄影行业的冲击极为「惨烈」;而从 AI 发展的角度看,OpenAI 也再次证明了单纯的分辨率并不能从根本提升 AI 的工作效率,推理能力才是 AI 图像的核心竞争力领域。
在 AI 图像时代,OpenAI 已经为我们开了一个好头。接下来,就得看 Google 和国内 AI 巨头们该如何应对了。
2026第十九届北京国际汽车展览会将于4月24日至5月3日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以“领时代·智未来”为主题,集中展现汽车工业的更多黑科技。
比亚迪、小米、鸿蒙智行(问界等)、小鹏、蔚来、岚图等头部品牌集结,多款重磅新车首秀;地平线、Momenta、卓驭等供应商集体秀肌肉,AI大模型深度赋能,高阶智驾、动力电池、超快充技术等前沿科技集中亮相,看点拉满!
雷科技旗下「电车通」将派出报道团直击现场,以“关注电动车,更懂智能化”的专业视角,带来一线独家报道,敬请关注!
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106256