MinT(Mind the Time)是由Snap Research、多伦多大学和向量研究所共同开发的一款专注于多事件视频生成的框架。该框架基于时间基位置编码(ReRoPE)技术,能够精准地将文本提示与视频中的特定时间段匹配,从而生成包含多个事件且顺序准确的视频序列。MinT不仅实现了对事件持续时间的精确调控,还确保了视频内容的整体连贯性和视觉质量,为视频创作提供了前所未有的灵活性与控制力。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部