ComfyUI中的ERNIE-Image支持:准确的文本渲染和结构化图像生成
今天,我们宣布百度的开源ERNIE-Image框架,一个Apache-2.0许可的文本到图像模型,加入了ComfyUI生态系统。由一个80亿参数的扩散变换器架构提供支持,这个强大的开源权重系统通过其集成的提示增强功能,从简短的输入中创建更详细的结果。
核心能力
文本精度: 生成复杂的英文、中文和多语言布局
指令遵从: 处理复杂的指令、对象关系和知识丰富的描述
结构化视觉创作: 生成海报、漫画、多场景故事板
艺术灵活性:从真实照片到电影美学的图像生成
资源效率:在24GB VRAM和8B参数下运行
提示增强:3B辅助模型丰富了最少的输入
视觉演示
版面和排版应用

咖啡制作流程的教育漫画风格信息图。背景有淡褐色旧纸质质感。在图像顶部居中位置是粗体棕色标题“咖啡制作流程”,下方有小的英文副标题“How Coffee is Made”。主体部分由六个步骤块组成,通过棕色虚线箭头相互连接,排列成“Z”型的视觉引导。第一个步骤位于左上角,展示了一棵满是成熟红色咖啡果实的咖啡树,旁边是一个剖开的咖啡果实,显示里面的咖啡豆,标签为“步骤1:采摘咖啡果”。第二步位于中上位置,展示了装满咖啡豆的木质发酵箱,标签为“步骤2:去皮和发酵”。第三步位于右上位置,描绘了咖啡豆在竹席上阳光下干燥,标签为“步骤3:日光干燥”。第四步位于左下角,展示了一个古董金属烘焙机,咖啡豆在里面翻滚,蒸汽上升,标签为“步骤4:烘焙”。第五步位于中下位置,展示了石磨倒出的细腻咖啡粉,标签为“步骤5:研磨”。第六步位于右下角,展示了生产线上咖啡液被倒入模具中,旁边是成品包装咖啡,标签为“步骤6:冲泡和成型”。图像的四个角落都装饰有手绘的咖啡叶和咖啡豆。整体色调由暖棕色、焦糖色、奶油色、深红色和橄榄绿色组成,线条细腻,布局清晰。

顶部左侧面板1:广角镜头一名年轻女性站在红色外套的雨天火车站。字幕框:“她已经等待了三年这个时刻。”顶部右侧面板2:特写镜头她的脸焦虑的眼睛,雨水滴在脸颊上。没有文本。中间左侧面板3:中景镜头火车抵达,车门滑开,蒸汽上升。声音效果文本:“WHOOOOSH”中间右侧面板4:她的视角一名穿着灰色夹克的男子背对着她一步一步走出。底部左侧面板5:特写镜头她手指颤抖地向前伸出。底部右侧面板6:广角镜头他们在同一把伞下面对面。字幕框:“有些到来改变了一切。”钢笔和水彩风格,冷蓝灰调色板,富有表现力的线条艺术。跨越所有6个面板的同一角色设计保持一致。
电影表达
概念海报,垂直分屏布局,左侧代表现在和未来,背景是深灰色的干燥土地纹理,刻画着缓慢的静态结构衰变和时间侵蚀。右侧代表过去,过去正在剧烈地分解和爆炸,产生混乱的尘埃和碎石,背景是深红色和黑色,时钟框架的一半是坚固的石头,另一半正在分解成粒子,连接两个世界。红色时针完全位于左侧的现在/未来一侧,体现了时间、过去与未来、缓慢衰变与暴力崩溃的概念。超现实的3D渲染,电影般的戏剧性照明,高对比度,左侧有清晰的细节,右侧有动态粒子效果,真实的地球纹理和飘浮的尘埃,未来主义的图形设计,简洁的红色垂直UI元素和定制的技术文本覆盖层,顶部右侧的标题文本为“永恒黎明”,顶部右侧的小红色技术元数据文本为“SPECDARY BOTHUNG”,底部右侧的紧密行小红色技术数据块包括“时间戳:00:00:00”,“崩溃率:99.8%”,“时间异常检测”,“过去维度:衰退”,红色水平强调条和底部的页脚文本“永恒衰退”,顶部左侧的小红色标题文本“时间转换协议”,垂直红色强调线和小红色技术文本注释包括“现在:稳定”,“未来:展开”,中间的红色文本“警告:时间分解”,底部中心的小红色页脚文本“过去消失,未来崛起”,以高端科幻电影海报的风格拍摄,超高分辨率,真实的电影化,戏剧性的深度,阴暗和紧张的气氛,详细的粒子模拟,真实的材质渲染。提示:第一人称垂直现实世界城市夜景照片。狭窄,湿润,繁忙的城市街道,有强烈的深度感;两边高大的建筑物上有消防通道,管道,空调单元,温暖的窗户灯光。左边的红色垂直“酒店”霓虹灯,右边的明亮蓝色“酒吧”招牌和黄色“24小时营业”框。远处巨大的数字广告牌发出青色“霓虹城市”的光芒。粗糙的湿地面反映出霓虹灯的光芒;一辆老式黄色出租车带有“出租车”标志驶过中心,红色尾灯亮起。两名穿着黑色大衣和黑色雨伞的行人沿着右侧人行道走开。巨大的针状钢电视塔从建筑物的缝隙中探出,红色的航空警示灯亮起。电影式的体积光,迷雾弥漫的空气,冷却的青蓝色与温暖的橙红色对比,身临其境的感觉。

一个迷人的,富有想象力的3D插图,特征是一个蓬松,绒毛质感的白色鸭子舒适地坐在一个模糊的珊瑚粉色扶手椅上,手里拿着一杯冒着热气的黑咖啡,背景是实心的温暖珊瑚红色;其定义的特点是所有元素都具有触觉,拥抱般的织物般的质地,一个大胆,简约的温暖色调的奶油白,生动的橙色和丰富的红色,温和的人性化,融合了可爱和休闲放松的感觉,柔和的漫射光线,以及一种细微的电影颗粒感,增加了怀旧的,手工制作的感觉,营造出一种玩耍却宁静的氛围,适合放松和早晨日常的主题。
多帧布局
提示:教育漫画书信息图。五个垂直面板并排,泥土色调,手绘插图风格。顶部标题:“北美本土物种”。风格:漫画线条,水彩填充,白色面板背景,粗体标题。面板1:灰松鼠拿着橡果。标题:“东部灰松鼠”事实:“埋葬橡果以帮助森林生长。”箭头→尾巴:“浓密的尾巴”面板2:有橙红色胸脯的知更鸟在树枝上。标题:“美国知更鸟”事实:“春天回归的标志。”箭头→胸脯:“橙红色胸脯”面板3:有秋季叶子的红枫树。标题:“红枫树”事实:“一年四季庇护野生动物。”箭头→叶子:“秋季红色”面板4:白尾鹿举起白色尾巴。标题:“白尾鹿”事实:“白尾巴发出危险信号。”箭头→尾巴:“警报信号”面板5:在花朵上飞舞的帝王蝶。标题:“帝王蝶”事实:“每年迁徙3000英里。”箭头→翅膀:“警告颜色”
实施指南
更新到ComfyUI v0.19.1或更高版本
访问“模板”并找到ERNIE-Image
选择并激活ERNIE-Image工作流
下载所需资产,配置提示并执行
可访问模型
🤗 ERNIE-Image - 主要模型在大约50步内交付高质量输出
🤗 ERNIE-Image-Turbo - 加速迭代在8步内生成
开始您的创作之旅!