前两天有个朋友尝试用AI做架构图,说效果很拉胯,前段时间被GPT Image 2的炸裂效果刷屏,正好今天实测一波。
主题是生成一张“Hermes Agent vs OpenClaw 总体架构差异”的技术对比图。
选了几款国内外生图领域的代表选手:ChatGPT(Image 2)、Gemini思考模式(Pro模式太拥挤被自动降级了)、即梦Seedream 5.0 lite、通义万相2.7 Pro
第一轮:基础提示词即梦:图片最简单,而且有明显奇怪的文字,效果比较糙。(下面这张是四张里效果最好的)
写作最后效果很明显:ChatGPT > Gemini > 通义万相 > 即梦
(这个结果仅代表架构图这个场景,我在其他生图场景中,同样的提示词,有时候能明显感觉即梦会比万相好)
但是ChatGPT和Gemini都需要科学上网,国内用户不太友好。
不过对于这种结构性的内容,还有个更实用的替代方案:用AI直接生成静态网页。WorkBuddy这些龙虾类智能体工具都能轻松做到,代码直接输出,结构清晰还不会画歪。
不过如果想在一个固定尺寸里展示,提示词上可能得多调调。
下面是我用WorkBuddy参照前面两轮提示词的内容做的静态页面截图效果。

相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107542