使用 AI 创建令人惊叹的四格动漫表情符号:全面教程
使用 AI 生成带有夸张表情的四格动漫风格表情符号!学习如何整合图像理解、风格迁移和面部控制,打造统一的表情符号图像。立即试试吧!
- 显存
- 中等显存(12–16GB)
- 阅读时间
- 3 分钟
工作流概览
使用 AI 生成带有夸张表情的四格动漫风格表情符号!学习如何整合图像理解、风格迁移和面部控制,打造统一的表情符号图像。立即试试吧!
内容类型: Workflow
主要用途: Download
所需模型
- Flux
- Lora
- Sd
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:中等显存(12–16GB)。
- 使用上方下载按钮将工作流 JSON 导入 ComfyUI。
1. 工作流概述

该工作流用于生成4格动漫风格表情包,包含夸张生动的角色表情(如认真思考、惊讶张嘴、害羞微笑、愤怒暴躁)。核心流程结合了图像理解、风格化生成和面部特征控制技术,最终输出四等分布局的标准化表情包图像。
2. 核心模型
模型名称 | 功能描述 |
|---|---|
Florence-2-large | 微软开发的视觉-语言模型,用于图像分割和描述生成 |
Janus-Pro-1B | 多模态模型,解析输入图像并生成详细文本描述 |
Stable Diffusion (Flux版) | 基础图像生成模型,配合多个LoRA实现动漫风格化 |
PuLID Flux | 面部特征控制模型,确保角色表情的一致性 |
3. 关键组件
3.1 必须安装的节点
Florence2系列节点:通过ComfyUI Manager安装,用于图像分割和遮罩生成。
JanusImageUnderstanding:需手动安装 Janus-Pro 模型,解析图像内容。
PuLID Flux系列节点:需下载 pulid_flux_v0.9.1.safetensors 并放入
models/pulid文件夹。
3.2 特殊依赖
LoRA模型:
Flux吉卜力动漫风格插画_V1.0(风格化)GPT-4o风格卡通IP形象一致性表情包F.1_v1.0(表情控制)需从平台(如LibLibAI)下载并放入
models/loras。
4. 工作流结构
Group名称 | 输入参数 | 输出结果 | 功能说明 |
|---|---|---|---|
Florence2 | 上传的参考图像 | 角色遮罩+描述文本 | 分割角色并生成服装/背景描述 |
Janus反推 | 参考图像 | 详细角色描述文本 | 补充Florence2的文本细节 |
文本融合 | Florence2+Janus的文本 | 组合提示词 | 生成最终的正向提示词 |
PuLID Flux | 角色遮罩+提示词 | 带面部控制的条件模型 | 确保表情一致性和风格化 |
图像生成 | 分辨率(768x1024)、种子值、采样器 | 四格表情包 latent | 使用Euler采样器生成图像 |
后处理 | latent图像+VAE | 最终PNG输出 | 解码并保存结果 |
5. 输入与输出
输入:
必填:参考图像(1024x1024)、提示词模板(如“夸张表情+白色衬衫”)。
可选:种子值、LoRA权重(默认0.45-1.0)。
输出:四格表情包PNG(带元数据)。
6. 注意事项
显存需求:建议≥12GB显存,分辨率过高可能导致OOM。
错误排查:若缺少节点,检查
ComfyUI-Manager或手动安装依赖模型。兼容性:仅支持 Flux 版本的Stable Diffusion模型。