释放 AI 驱动的视频角色重绘能力:用风格化效果焕新视频画面

CN
ComfyUI.org
2025-04-10 20:49:19

使用 Wan2.1Fun 解锁 AI 驱动的视频角色重绘功能!探索该工作流程如何结合 Stable Diffusion、GroundingDino 和 OpenPose,将角色转化为风格化图像与视频。深入了解,全面提升你的视频编辑技能!

使用场景
Video
适用场景
Video
关键节点
Controlnet
显存
中等显存(12–16GB)
阅读时间
4 分钟
查看所需模型更多 Video 工作流

工作流概览

使用 Wan2.1Fun 解锁 AI 驱动的视频角色重绘功能!探索该工作流程如何结合 Stable Diffusion、GroundingDino 和 OpenPose,将角色转化为风格化图像与视频。深入了解,全面提升你的视频编辑技能!

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1
  • Controlnet
  • Sd

所需节点

  • Controlnet

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:中等显存(12–16GB)。

1. 工作流概述

m9bcxa9039jmk1jgsyz6acf8a263f6107cfe1be787f47dac5a192127eb2c95e5b29502af4c8bfad8e83.png

该工作流名为 “wan2.1Fun_视频人物转绘”,主要功能是通过AI模型将视频中的人物转换为特定风格的图像或视频。工作流结合了多个先进技术,包括:

  • 视频帧提取:从输入视频中提取关键帧。

  • 人物分割与姿势识别:使用GroundingDino和SAM模型分割人物,Openpose提取姿势。

  • 文本/图像引导生成:通过Stable Diffusion模型(如Wan2.1-Fun-Control)生成新图像。

  • 视频合成:将生成的帧重新合成为视频。

2. 核心模型

  1. Stable Diffusion (Wan2.1-Fun-Control-14B)

    • 用途:基于文本和图像提示生成高质量图像或视频。

    • 模型文件:Wan2.1-Fun-Control-14B_fp8_e4m3fn.safetensors

  2. GroundingDino + SAM

    • 用途:检测并分割视频中的人物(如man标签)。

    • 模型文件:GroundingDINO_SwinT_OGCsam_vit_b_01ec64.pth

  3. ControlNet (Openpose)

    • 用途:保持原始视频中人物的姿势结构。

    • 模型文件:control_v11p_sd15_openpose.pth

  4. Florence2

    • 用途:自动生成图像描述(提示词反推)。

    • 模型文件:Florence-2-large

3. 关键组件(Nodes)

  • 视频输入

    • VHS_LoadVideo:加载视频文件(如2795746-uhd_2160_3840_25fps.mp4)。

  • 人物处理

    • GroundingDinoSAMSegment:分割人物并生成掩码。

    • OpenposePreprocessor:提取人物姿势关键点。

  • 生成控制

    • WanVideoTextEncode:处理文本提示词(如“未来感机器人”)。

    • WanVideoSampler:控制生成过程的采样参数(如步数25、CFG值8)。

  • 输出合成

    • VHS_VideoCombine:将生成的帧合成为MP4视频(H.264编码)。

4. 工作流结构(Group分解)

  1. 视频第一帧角色重绘

    • 输入:视频文件、文本提示词。

    • 输出:重绘后的第一帧图像。

  2. Wan2.1视频人物转绘

    • 输入:分割后的人物掩码、姿势数据。

    • 输出:风格化的人物视频。

  3. 提示词反推(Florence2)

    • 输入:参考图像。

    • 输出:自动生成的详细描述文本。

5. 输入与输出

  • 输入参数

    • 视频文件(MP4格式)。

    • 文本提示词(可选)。

    • 生成参数(分辨率512x910、采样器Euler等)。

  • 输出结果

    • 生成的视频文件(如AnimateDiff_00027.mp4)。

6. 注意事项

  1. 依赖安装

    • 需通过ComfyUI Manager安装以下插件:

      • ComfyUI-WanVideoWrapper(视频生成)。

      • comfyui_controlnet_aux(姿势提取)。

      • comfyui-florence2(提示词反推)。

  2. 硬件要求

    • 建议显存≥12GB(因Wan2.1模型较大)。

  3. 常见问题

    • 模型路径错误:检查safetensors文件是否放入正确目录。

    • 视频编码失败:调整VHS_VideoCombine的CRF值(默认19)。

常见问题