HunyuanVideo v2 版本修复了 Image to video 模型

在最初发布他们期待已久的影像转视频模型一天后,HunyuanVideo 团队发布了一个新的“修复”版本。
这个我称之为 v2 “替换” 模型的新模型实际上是一个架构略有不同的新模型。
v2 模型似乎比 v1 模型更紧密地遵循引导图像,但 v1 模型可能具有更好的运动和提示跟随。两者都很有趣,并且可能有用,具体取决于您想要什么。
Hunyuan Video 是一种文本到视频的模型。
从这里下载 clip_l.safetensors 和 llava_llama3_fp8_scaled.safetensors 文件,并将它们放在你的 ComfyUI/models/text_encoders 目录中。
下载 hunyuan_video_vae_bf16.safetensors 文件并将其放在 ComfyUI/models/vae 文件夹中。
文本转视频
下载 hunyuan_video_t2v_720p_bf16.safetensors 文件并将其放在 ComfyUI/models/diffusion_models 文件夹中。
此模型还可以通过将视频长度设置为 1 来生成静止图像。

图像到视频
下载 llava_llama3_vision.safetensors 文件并将其放在您的 ComfyUI/models/clip_vision/ 文件夹中。
您可以选择两种不同的模型,它们会产生不同的结果。
v1 “连接”
第一个模型比另一个模型更少地遵循引导图像,但可能会提供更好的运动。
下载 hunyuan_video_image_to_video_720p_bf16.safetensors 文件并将其放在 ComfyUI/models/diffusion_models/ 文件夹中。

v2 “替换”
第二个模型非常接近引导图像,但似乎比第一个模型少一些活力。
下载 hunyuan_video_v2_replace_image_to_video_720p_bf16.safetensors 文件并将其放在 ComfyUI/models/diffusion_models/ 文件夹中。

课件资料:
RunningHub工作流:https://www.runninghub.cn/post/1898150330008588290/?utm_source=kol01-RH067
夸克网盘:https://pan.quark.cn/s/5b59103