AI 图像生成公司 Ideogram 发布了 4.0 版本文本到图像模型,首次以开放权重形式发布。该模型参数量为 93 亿,支持原生 2K 分辨率、透明背景和精确的布局控制。
Ideogram 4.0Ideogram 4.0 是一个基于 Diffusion Transformer 架构的文本到图像模型,采用单流设计,文本和图像 token 在 34 层网络中共享投影。文本编码器使用 Qwen3-VL-8B-Instruct ,从 13 个中间层提取隐藏状态(来源: Ideogram 官网)。
该模型新增了四项核心功能。原生 2K 分辨率输出,无需后期放大。透明背景生成,设计师无需额外抠图。基于边界框的精确布局控制,用户可以通过 JSON 描述物体位置。文字渲染能力提升,适用于 Logo 和海报设计(来源: The Decoder )。
Ideogram 表示,可编辑文字和图层功能将在后续版本中上线(来源: Ideogram 官网)。
评测排名根据 DesignArena 排行榜, Ideogram 4.0 在所有开放权重模型中排名第一。在文本到图像竞技场中,该模型在质量模式下排名第一,综合排名第九,仅落后于 OpenAI 和 Google 的闭源模型(来源: The Decoder )。
在 The Decoder 的基准测试中, Ideogram 4.0 超过了 Midjourney v8 ,与 Flux 基本持平(来源: The Decoder )。
定价Ideogram 4.0 通过官方 API 提供三个质量层级(来源: Ideogram 官网):
质量层级
每张图片价格
Turbo
0.03 美元
Default
0.06 美元
Quality
0.10 美元
开放与授权Ideogram 4.0 的权重和代码已在 GitHub 开源( ideogram-oss/ideogram-4 ),用户可以下载并在本地硬件上运行。模型支持使用自有数据进行微调。商业使用需要付费授权(来源: Ideogram 官网)。
该模型同步上线多个合作伙伴平台,包括 Hugging Face 、 ComfyUI 、 fal 、 Runware 、 Magnific 、 Krea AI 、 Leonardo AI 、 Picsart 、 Cloudflare 、 Replicate 等(来源: The Decoder )。
公司背景Ideogram 成立于 2022 年,总部位于加拿大多伦多,创始团队来自 Google Brain 、 UC Berkeley 、 CMU 和多伦多大学。公司于 2024 年完成 8000 万美元 A 轮融资,目前约有 67 名员工(来源: Ideogram 官网 / LeadIQ )。
竞争格局2026 年 AI 图像生成领域竞争激烈。微软于 5 月 26 日发布了 MAI-Image-2.5 ,在 Arena 排名第三。 Google 的 Gemini Omni 支持多模态输入和视频编辑。 Ideogram 4.0 的差异化在于开放权重和文字渲染能力(来源: Gigazine )。
从版本迭代速度看, Ideogram 从 1.0 到 4.0 用了约 18 个月。版本 1.0 发布于 2024 年 2 月, 2.0 于 2024 年 8 月, 3.0 于 2025 年 3 月(来源: Ideogram 文档)。
相关文章



猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113740