> 自媒体 > (AI)人工智能 > ChatGPT Images 2.0突然发布,排版设计能力巨大提升
ChatGPT Images 2.0突然发布,排版设计能力巨大提升
来源:观察者网
2026-04-30 10:51:24
162
管理

(文/万肇生 编辑/张广凯)

当地时间4月21日,美国人工智能公司OpenAI对外正式推出ChatGPT Images 2.0模型,这是其ChatGPT平台内图像生成功能的最新一次升级。

该模型旨在提升对图像生成指令的“听话”程度、细节保真度以及文本渲染质量,尤其在处理图像中的文字元素时表现出明显进步。

生成具有风格化的菜单,字体清晰不粘连图自TechCrunch

除了英文文本,模型在非拉丁语系文字处理上也有提升,支持包括中文在内的多种语言的准确渲染。这使得它在生成包含多语言元素的图像时更具实用性。

对此,观察者网通过免费生成功能的简单指令,让其制作一份会员服务“观察员”的宣传海报。其中,海报内汉字清晰可见,极少有以往AI图像生成时出现的笔划粘连情况,而且海报布局合理,完成度较高,抽卡方面较以往图片模型显著友好。

但美中不足的是,由于未指明具体文案,除了“观察员”外,会员的功能权益、定价、LOGO等文案内容有一定程度的出入。不过,这不妨碍该海报在经过后期美术简单处理后,得以实现产能意义上的快速爬坡。

ChatGPT生成的“观察员”海报,如果去掉有出入的文案部分,整体设计完成度已达到较高水平。

另一方面,图片思考模式还引入了推理能力,可以让模型进行网络搜索以获取最新信息,并进行自我检查以优化输出。这些能力意味着图像生成速度,远不如直接与ChatGPT对话那么快,但实测中生成像多格漫画这样复杂的内容时,该模型仍然只需几分钟。

需要注意的是,在AI图像生成领域,扩散模型和自回归模型是两种主流的技术路线,如今前沿模型通常将两者结合,而OpenAI未解释该模型底层架构属于哪种。不过,随着OpenAI推动图像生成技术的进步,势必会进一步增加人类识别AI生成内容的难度,引发对虚假内容的担忧。

美国财经媒体《商业内幕》(Business Insider)就认为,此类模型具备生成逼真图像的能力,很容易被用于创建具备误导性的图片或伪造照片。而模型的“思考”模式接入网络搜索,虽有助于事实核查,但其基于截止2025年12月的数据库,随着时间可能放大生成内容的时效性风险。

正如上文生成的“观察员”海报一样,文案内容与真实权益出入较大,这不得不让人担心,AI在生成新闻配图、产品宣传或社交媒体内容时,若任由其自主生成文案、且缺乏明确的AI生成标记,可能将导致错误信息传播的情况。

历史经验显示,类似的模型工具曾被不法之人用于创建深度伪造内容,因此平台责任与用户自律一样重要。但目前,OpenAI还未公布针对Images 2.0的特定新安全机制细节。此外,OpenAI也没有透露训练数据来源,一旦模型生成与现有人类作品高度相似的图像时,也可能引发版权之争。

但抛去上述风险,从技术向善的角度出发,ChatGPT Images 2.0仍然不失为一次务实的迭代升级。它在文本渲染、指令遵循和复杂构图方面的改进,使AI图像生成更接近日常实用水平,而非仅停留在概念演示。经过几轮简单的测试结果也能看出,该模型在简单商业场景中已能产生可用成果,这本身就是对过去两年技术瓶颈的突破。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
朴一生(普通会员)
文章
1936
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105985

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索