Ideogram 4.0 Day-0 支持于 ComfyUI:开放权重和结构化控制

CN
2026-06-04 02:10:23

一个9.3B开源权重的文本到图像模型,能够像阅读规格说明书一样读取JSON提示。

阅读时间
2 分钟
下载工作流 JSON查看所需模型

工作流概览

一个9.3B开源权重的文本到图像模型,能够像阅读规格说明书一样读取JSON提示。

内容类型: Workflow

主要用途: Download

所需模型

  • Ideogram 4

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 使用上方下载按钮将工作流 JSON 导入 ComfyUI。
Subgraph Parameter Panel

开源社区见证了一个里程碑时刻! Ideogram 正式推出首个面向公众的基础模型,象形文字4.0从发布第一天起,就顺利集成到ComfyUI中。

这款具有9.3亿参数的开创性文本到图像系统,没有使用任何现有框架,成为了设计海报、排版和生成清晰文本的首选解决方案——完全不受封闭API的限制。现在就体验一下。

获取模板


通过结构化格式的高级操作

在这里, Ideogram 4.0 展现了其价值所在。虽然标准的文本请求会产生图像,但是使用组织结构会提供细致入微的权威性。通过传统的提示无法实现的三种能力:

  • 配色方案每个项目最多可应用16个十六进制值(每个组件5个)

  • 空间定位: 使用区域定义[y_min, x_min, y_max, x_max]归一化后的0-1000坐标

  • 格式化文本组件将内容字符串与其视觉样式规格分开

推荐: 通过坐标、色调或元素设计将连接锚定到提示中,可以提高精度。模型训练大量使用详细场景,奖励明确的定义。

提示模板结构:

{ "high_level_description": "", "style_description": { "aesthetics": "", "lighting": "", "photo": "", "medium": "", "color_palette": [] # 十六进制值 }, "compositional_deconstruction": { "background": "", "elements": [ { "type": "obj", # 对象 "bbox": [], # y_min, x_min, y_max, x_max "desc": "", "color_palette": [] # 十六进制值 }, { "type": "text", # 文本 "text": "", # 要渲染的文本 "bbox": [], # y_min, x_min, y_max, x_max "desc": "", "color_palette": [] # 十六进制值 } ] } }


示例

Subgraph Parameter PanelSubgraph Parameter PanelSubgraph Parameter PanelSubgraph Parameter PanelSubgraph Parameter PanelSubgraph Parameter Panel

内容安全机制

该模型集成了本机完整性检查,这与 ComfyUI 功能是不同的。生成阻塞或空结果表示内部审查。调整提示仍然是解决方案,因为这个不可变组件来自基本配置。


配置步骤

  1. 更新环境: 确保 ComfyUI 版本达到 0.24.0

  2. 模板获取: 从提供的仓库中检索工作流配置

  3. 模型设置: 根据工作流规范放置资产

  4. 操作: 在工作流执行中使用文本指令或组织格式

获取模板

访问配置: 权重
仓库: 项目来源

庆祝创新!

常见问题