
时隔500多天后,此次发布的DALL·E 3拥有多个新特性,钛媒体App简单梳理如下:
DALL·E 3 具备更强大的图像细节和差异识别能力,使用户更易将想法转化为准确的图像,并解决了之前版本DALL·E不会写字的问题。DALL·E 3 的一个主要特点是与 ChatGPT 的集成。此集成允许用户更简单地创建 prompt(提示词),因为当输入一个想法时,ChatGPT 会自动为DALL·E 3生成详细的 prompt。DALL·E 3 在图像质量和对 prompt 的准确性上都有所增强。相比于上一代,新版本更能理解文本的上下文和更长的 prompt,处理效果更佳。安全性方面,OpenAI 在DALL·E 3上制定了强有力的安全措施,以防止创建有害图像,它也不能生成公众人物的图像。同时,DALL·E 3不会生成在世的艺术家的风格图像,避免了之前版本中的争议,而艺术家可以提交自己的作品并要求从未来的文本到图像 AI 模型中移除,保证其版权不被侵犯。DALL·E 3计划在10月先向特定用户发布,并计划在秋季向研究实验室及其 API 服务发布。OpenAI 还未明确是否会发布免费的公开版本。简单来说,利用ChatGPT,新的DALL·E 3实现了更准确的图像生成能力,更好的体验效果,以及更安全的文生图规范。
OpenAI研究员Sandhini Agarwal 表示,她对DALL·E 3的安全性“高度有信心”,并表示该模型在不断改进。
值得一提的是,目前,国内外已经有多个对标DALL·E的文生图模型AIGC公司和应用,其中包括独角兽公司Stability AI的开源文生图模型Stable Diffusion,Midjourney,英伟达的Perfusion模型,阿里巴巴的通义万象,智源研究院的开源双语模型AltDiffusion,HiDream智象未来的Pixeling(千象),阿里大文娱旗下妙鸭相机,网易伏羲旗下模型丹青等。
然而,当前 AI 生成的图像仍存在一些问题。华盛顿特区一家法院8月裁定,根据美国法律,未经任何人工输入而由人工智能创作的艺术作品不能获得版权。
当前,OpenAI仍面临多起诉讼。其中,美国作家贸易组织代表约翰·格里沙姆(John Grisham)和《权力的游戏》小说家乔治·马丁(George RR Martin)等作家起诉该公司,指控ChatGPT非法训练学习他们的作品。
(本文首发钛媒体App,作者|林志佳)
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105610