MarDini是一款先进的视频生成工具,结合了掩码自回归(MAR)和扩散模型(DM)的优势,适用于大规模视频生成任务。该模型能够处理任意数量和位置的掩码帧,支持视频插值、图像到视频生成、视频扩展等多样化任务。通过将主要计算资源分配给低分辨率规划模型,MarDini实现了空间-时间注意力机制的高效应用,提升了视频生成的效率与灵活性。此外,该工具能够从无标签数据中从头开始训练,无需依赖图像生成的预训练模型,展现了出色的可扩展性与效率。
MarDini是一款先进的视频生成工具,结合了掩码自回归(MAR)和扩散模型(DM)的优势,适用于大规模视频生成任务。该模型能够处理任意数量和位置的掩码帧,支持视频插值、图像到视频生成、视频扩展等多样化任务。通过将主要计算资源分配给低分辨率规划模型,MarDini实现了空间-时间注意力机制的高效应用,提升了视频生成的效率与灵活性。此外,该工具能够从无标签数据中从头开始训练,无需依赖图像生成的预训练模型,展现了出色的可扩展性与效率。
发表评论 取消回复