多模态条件

首页

多模态条件

列表

默认

浏览次数

发布日期

STIV

STIV是一款由苹果公司开发的视频生成大模型，具有8.7亿参数，擅长文本到视频（T2V）及文本图像到视频（TI2V）任务。它通过联合图像-文本分类器自由引导（JIT-CFG）技术提升生成质量，并结合时空注意力机制、旋转位置编码（RoPE）及流匹配训练目标优化性能。STIV支持多种应用场景，包括视频预测、帧插值、长视频生成等，适用于娱乐、教育、广告及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 499 浏览

多模态条件 首页 多模态条件

列表 默认 浏览次数 发布日期

STIV

多模态条件

首页

多模态条件

列表

默认

浏览次数

发布日期