释放 AI 驱动的视频角色重绘能力:用风格化效果焕新视频画面
使用 Wan2.1Fun 解锁 AI 驱动的视频角色重绘功能!探索该工作流程如何结合 Stable Diffusion、GroundingDino 和 OpenPose,将角色转化为风格化图像与视频。深入了解,全面提升你的视频编辑技能!
- 使用场景
- Video
- 适用场景
- Video
- 关键节点
- Controlnet
- 显存
- 中等显存(12–16GB)
- 阅读时间
- 4 分钟
工作流概览
使用 Wan2.1Fun 解锁 AI 驱动的视频角色重绘功能!探索该工作流程如何结合 Stable Diffusion、GroundingDino 和 OpenPose,将角色转化为风格化图像与视频。深入了解,全面提升你的视频编辑技能!
内容类型: Workflow
主要用途: Download
所需模型
- Wan2.1
- Controlnet
- Sd
所需节点
- Controlnet
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:中等显存(12–16GB)。
1. 工作流概述

该工作流名为 “wan2.1Fun_视频人物转绘”,主要功能是通过AI模型将视频中的人物转换为特定风格的图像或视频。工作流结合了多个先进技术,包括:
视频帧提取:从输入视频中提取关键帧。
人物分割与姿势识别:使用GroundingDino和SAM模型分割人物,Openpose提取姿势。
文本/图像引导生成:通过Stable Diffusion模型(如Wan2.1-Fun-Control)生成新图像。
视频合成:将生成的帧重新合成为视频。
2. 核心模型
Stable Diffusion (Wan2.1-Fun-Control-14B)
用途:基于文本和图像提示生成高质量图像或视频。
模型文件:
Wan2.1-Fun-Control-14B_fp8_e4m3fn.safetensors。
GroundingDino + SAM
用途:检测并分割视频中的人物(如
man标签)。模型文件:
GroundingDINO_SwinT_OGC、sam_vit_b_01ec64.pth。
ControlNet (Openpose)
用途:保持原始视频中人物的姿势结构。
模型文件:
control_v11p_sd15_openpose.pth。
Florence2
用途:自动生成图像描述(提示词反推)。
模型文件:
Florence-2-large。
3. 关键组件(Nodes)
视频输入:
VHS_LoadVideo:加载视频文件(如2795746-uhd_2160_3840_25fps.mp4)。
人物处理:
GroundingDinoSAMSegment:分割人物并生成掩码。OpenposePreprocessor:提取人物姿势关键点。
生成控制:
WanVideoTextEncode:处理文本提示词(如“未来感机器人”)。WanVideoSampler:控制生成过程的采样参数(如步数25、CFG值8)。
输出合成:
VHS_VideoCombine:将生成的帧合成为MP4视频(H.264编码)。
4. 工作流结构(Group分解)
视频第一帧角色重绘
输入:视频文件、文本提示词。
输出:重绘后的第一帧图像。
Wan2.1视频人物转绘
输入:分割后的人物掩码、姿势数据。
输出:风格化的人物视频。
提示词反推(Florence2)
输入:参考图像。
输出:自动生成的详细描述文本。
5. 输入与输出
输入参数:
视频文件(MP4格式)。
文本提示词(可选)。
生成参数(分辨率512x910、采样器Euler等)。
输出结果:
生成的视频文件(如
AnimateDiff_00027.mp4)。
6. 注意事项
依赖安装:
需通过ComfyUI Manager安装以下插件:
ComfyUI-WanVideoWrapper(视频生成)。comfyui_controlnet_aux(姿势提取)。comfyui-florence2(提示词反推)。
硬件要求:
建议显存≥12GB(因Wan2.1模型较大)。
常见问题:
模型路径错误:检查
safetensors文件是否放入正确目录。视频编码失败:调整
VHS_VideoCombine的CRF值(默认19)。