视频 - 智狐AI导航

Higgsfield

Higgsfield是一款基于AI的视频生成平台，能够将文本提示转化为高质量视频内容，支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能，适用于社交媒体、广告及电影制作领域，提升创作效率与质量。

AI项目与工具 2025年06月12日 86 点赞 0 评论 562 浏览

Vace AI

Vace AI 是一款集成视频生成与编辑功能的 AI 工具，支持文本到视频、参考图像生成视频等功能，并提供风格转换、主体移除、画面扩展等编辑选项。基于先进模型技术，可精准保留关键视觉元素，生成高质量视频，适用于短视频制作、创意内容生成及广告设计等多种场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 661 浏览

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准，支持3D、4D、图像到视频（I2V）和文本到视频（T2V）等多种模态。它从可控性、质量和动态性三个维度进行评估，涵盖3000个测试样本，包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能，适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用，为研究

AI项目与工具 2025年06月12日 87 点赞 0 评论 840 浏览

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架，能够将静态照片转化为高质量动态视频。其核心在于混合引导机制，结合隐式面部表示、3D头球和身体骨架，实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配，适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域，具备高保真、强连贯性和广泛适用性。

AI项目与工具 2025年06月12日 86 点赞 0 评论 779 浏览

MoCha

MoCha 是一款由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型，支持语音与文本驱动的角色动画生成，具备全身动作模拟与多角色对话交互能力。其核心技术包括扩散变压器架构和语音-视频窗口注意力机制，确保动画与语音精准同步。适用于虚拟主播、影视动画、教育内容及数字人客服等多个领域，提升了内容创作效率与表现力。

AI项目与工具 2025年06月12日 34 点赞 0 评论 717 浏览

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架，结合大型语言模型与视频扩散模型，实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入，精确控制摄像机运动轨迹，具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果，并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域，提高视频创作效率与质量。

AI项目与工具 2025年06月12日 18 点赞 0 评论 722 浏览