使用 AI 创建令人惊叹的四格动漫表情符号:全面教程

CN
ComfyUI.org
2025-04-18 11:01:44

使用 AI 生成带有夸张表情的四格动漫风格表情符号!学习如何整合图像理解、风格迁移和面部控制,打造统一的表情符号图像。立即试试吧!

显存
中等显存(12–16GB)
阅读时间
3 分钟
查看所需模型

工作流概览

使用 AI 生成带有夸张表情的四格动漫风格表情符号!学习如何整合图像理解、风格迁移和面部控制,打造统一的表情符号图像。立即试试吧!

内容类型: Workflow

主要用途: Download

所需模型

  • Flux
  • Lora
  • Sd

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:中等显存(12–16GB)。
  • 使用上方下载按钮将工作流 JSON 导入 ComfyUI。

1. 工作流概述

m9mojjewcaa4jkospzd00faf8a9413e5bd80149a3e9d1dc613dda7a93f943fa802642f64ddb8a69e728.png

该工作流用于生成4格动漫风格表情包,包含夸张生动的角色表情(如认真思考、惊讶张嘴、害羞微笑、愤怒暴躁)。核心流程结合了图像理解、风格化生成和面部特征控制技术,最终输出四等分布局的标准化表情包图像。

2. 核心模型

模型名称

功能描述

Florence-2-large

微软开发的视觉-语言模型,用于图像分割和描述生成

Janus-Pro-1B

多模态模型,解析输入图像并生成详细文本描述

Stable Diffusion (Flux版)

基础图像生成模型,配合多个LoRA实现动漫风格化

PuLID Flux

面部特征控制模型,确保角色表情的一致性

3. 关键组件

3.1 必须安装的节点

  • Florence2系列节点:通过ComfyUI Manager安装,用于图像分割和遮罩生成。

  • JanusImageUnderstanding:需手动安装 Janus-Pro 模型,解析图像内容。

  • PuLID Flux系列节点:需下载 pulid_flux_v0.9.1.safetensors 并放入 models/pulid 文件夹。

3.2 特殊依赖

  • LoRA模型

    • Flux吉卜力动漫风格插画_V1.0(风格化)

    • GPT-4o风格卡通IP形象一致性表情包F.1_v1.0(表情控制)

    • 需从平台(如LibLibAI)下载并放入 models/loras

4. 工作流结构

Group名称

输入参数

输出结果

功能说明

Florence2

上传的参考图像

角色遮罩+描述文本

分割角色并生成服装/背景描述

Janus反推

参考图像

详细角色描述文本

补充Florence2的文本细节

文本融合

Florence2+Janus的文本

组合提示词

生成最终的正向提示词

PuLID Flux

角色遮罩+提示词

带面部控制的条件模型

确保表情一致性和风格化

图像生成

分辨率(768x1024)、种子值、采样器

四格表情包 latent

使用Euler采样器生成图像

后处理

latent图像+VAE

最终PNG输出

解码并保存结果

5. 输入与输出

  • 输入

    • 必填:参考图像(1024x1024)、提示词模板(如“夸张表情+白色衬衫”)。

    • 可选:种子值、LoRA权重(默认0.45-1.0)。

  • 输出:四格表情包PNG(带元数据)。

6. 注意事项

  1. 显存需求:建议≥12GB显存,分辨率过高可能导致OOM。

  2. 错误排查:若缺少节点,检查 ComfyUI-Manager 或手动安装依赖模型。

  3. 兼容性:仅支持 Flux 版本的Stable Diffusion模型。

常见问题