DragAnything 是由快手联合浙江大学与新加坡国立大学 Show Lab 共同研发的一种基于实体表示的可控视频生成方法。该技术通过简单的轨迹输入,实现对视频中任意物体的精确运动控制。其核心在于利用扩散模型的潜在特征来表征视频中的每个实体,从而突破传统方法中仅依赖像素点拖动所导致的控制局限性。DragAnything 提供了直观的交互方式,支持对前景、背景及相机运动的灵活控制,并在多项评估指标上取得了显著提升。 该工具具备实体级运动控制、多实体独立控制、用户友好的交互方式、相机运动控制以及高质量视频生成等核心功能。其技术原理包括实体表示、2D 高斯表示、扩散模型、轨迹引导的运动控制以及损失函数与优化机制。DragAnything 可广泛应用于视频创作、游戏开发、教育、广告和娱乐等多个领域。 项目官网、GitHub 仓库及 arXiv 技术论文均可获取详细信息。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部