AnyCharV

简介：AnyCharV是一款由多所高校联合研发的角色可控视频生成框架，能够将任意角色图像与目标场景结合，生成高质量视频。它采用两阶段训练策略，确保角色细节的高保真保留，并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型，具备良好的泛化能力，适用于影视制作、艺术创作、虚拟现实等多个领域。

AI小编 309 阅读 0 评论 73 点赞

项目地址

AnyCharV是由香港中文大学、清华大学深圳国际研究生院和香港大学联合研发的一种角色可控视频生成框架。该框架能够将任意参考角色图像与目标驱动视频相结合，生成高质量的角色视频。其采用两阶段训练策略，第一阶段通过细粒度分割掩码和姿态信息实现自监督合成；第二阶段则利用自增强训练和粗粒度掩码优化角色细节的保留。实验表明，AnyCharV在保持角色外观细节方面表现出色，并支持复杂的人-物交互和背景融合。此外，该工具可与文本到图像（T2I）和文本到视频（T2V）模型生成的内容结合，展现出强大的泛化能力。

本文分类：AI项目与工具
本文标签：AI视频生成角色控制视频合成文本到视频 T2V 图像到视频人工智能深度学习视频生成框架人-物交互
浏览次数：309 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/8938.html

评论列表共有 0 条评论

暂无评论

AnyCharV

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复