视频 - 智狐AI导航

DiTCtrl

DiTCtrl是一种基于多模态扩散变换器架构的视频生成工具，能够利用多个文本提示生成连贯且高质量的视频内容，无需额外训练即可实现零样本多提示视频生成。它通过KV共享和潜在混合策略优化不同提示间的平滑过渡，同时在MPVBench基准上表现出色，适用于电影、游戏、广告及新闻等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 804 浏览

Cobra

Cobra是由清华大学、香港中文大学和腾讯ARC实验室联合开发的漫画线稿上色框架，采用因果稀疏注意力机制和局部可复用位置编码技术，实现高精度、高效率的自动上色。支持颜色提示调整，提升灵活性与个性化。适用于漫画、动画、插画等多种场景，具有高效的推理能力和良好的扩展性。项目已开源，包含技术论文与模型资源。

AI项目与工具 2025年06月11日 21 点赞 0 评论 804 浏览

Powtoon

Powtoon 创建视觉交流都会放大您的结果。通过数百个动画角色、模板、视频背景、配乐等讲述引人入胜的故事。

创作工具 2026年07月29日 0 点赞 0 评论 804 浏览

Aiva.ai

我们的使命是通过使用 AI 创建个性化配乐来增强个人能力

创作工具 2026年07月29日 0 点赞 0 评论 804 浏览

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架，结合大型语言模型与视频扩散模型，实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入，精确控制摄像机运动轨迹，具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果，并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域，提高视频创作效率与质量。

AI项目与工具 2025年06月12日 18 点赞 0 评论 805 浏览