T2V-Turbo 是一种由 Google、UC Santa Barbara 和 University of Waterloo 的研究人员共同开发的先进文本到视频生成模型。该模型通过在预训练的 T2V 模型的一致性蒸馏过程中融合多种可微分奖励模型的反馈,实现了快速且高质量的视频生成。在 VBench 评估平台上,T2V-Turbo 在仅需四步推理的情况下生成的视频质量已超越了需要五十步迭代的传统模型,并且其性能超过了 Gen-2 和 Pika 等复杂模型。后续推出的 T2V-Turbo-v2 版本进一步整合了高质量训练数据、奖励模型反馈以及条件指导,显著提升了视频的视觉质量和文本与视频的对齐精度。
发表评论 取消回复