视频 - 智狐AI导航

MoCha

MoCha 是一款由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型，支持语音与文本驱动的角色动画生成，具备全身动作模拟与多角色对话交互能力。其核心技术包括扩散变压器架构和语音-视频窗口注意力机制，确保动画与语音精准同步。适用于虚拟主播、影视动画、教育内容及数字人客服等多个领域，提升了内容创作效率与表现力。

AI项目与工具 2025年06月12日 34 点赞 0 评论 794 浏览

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架，能够将静态照片转化为高质量动态视频。其核心在于混合引导机制，结合隐式面部表示、3D头球和身体骨架，实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配，适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域，具备高保真、强连贯性和广泛适用性。

AI项目与工具 2025年06月12日 86 点赞 0 评论 877 浏览

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准，支持3D、4D、图像到视频（I2V）和文本到视频（T2V）等多种模态。它从可控性、质量和动态性三个维度进行评估，涵盖3000个测试样本，包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能，适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用，为研究

AI项目与工具 2025年06月12日 87 点赞 0 评论 928 浏览

Vace AI

Vace AI 是一款集成视频生成与编辑功能的 AI 工具，支持文本到视频、参考图像生成视频等功能，并提供风格转换、主体移除、画面扩展等编辑选项。基于先进模型技术，可精准保留关键视觉元素，生成高质量视频，适用于短视频制作、创意内容生成及广告设计等多种场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 749 浏览

Higgsfield

Higgsfield是一款基于AI的视频生成平台，能够将文本提示转化为高质量视频内容，支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能，适用于社交媒体、广告及电影制作领域，提升创作效率与质量。

AI项目与工具 2025年06月12日 86 点赞 0 评论 650 浏览

MusicMint

MusicMint 是一款基于人工智能的音乐创作工具，支持多种音乐风格并提供高度自定义选项，如乐器、情绪、主题和结构等。用户可通过简单描述或选择参数快速生成原创音乐，并支持下载与分享。适用于个人创作、视频配乐、MV 制作及艺术项目等多种场景，是音乐爱好者和创作者的理想工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 546 浏览

Actor Mode

Actor Mode 是由 ElevenLabs 开发的 AI 语音生成工具，支持用户通过自身声音生成风格一致的语音内容。它具备多语言支持、语音属性调节、即时生成等功能，适用于有声读物、视频配音、虚拟助手等多个领域。用户可通过录制或上传音频，让 AI 提取语音特征并生成符合要求的语音输出，提高创作效率与个性化表达。

AI项目与工具 2025年06月12日 87 点赞 0 评论 872 浏览

Runway Gen

Runway Gen-4 是一款由 Runway 公司推出的高保真 AI 视频生成模型，能够跨场景保持人物、物体和环境的一致性，无需额外训练。用户仅需提供一张参考图和文字指令，即可生成具有真实物理效果和高质量视觉风格的视频内容。支持多种应用场景，如影视制作、动画创作、音乐视频、游戏开发和广告营销，有效提升创作效率并降低成本。

AI项目与工具 2025年06月12日 61 点赞 0 评论 773 浏览

Elmo Chat

Elmo Chat 是一款基于 AI 技术的浏览器扩展工具，支持网页、视频、PDF 等多种格式的内容摘要、实时问答、关键词提取及多语言翻译功能。无需注册即可使用，注重用户隐私保护，适用于学习、办公、视频处理及多语言信息获取等场景，提升信息处理效率与便捷性。

AI项目与工具 2025年06月12日 65 点赞 0 评论 785 浏览

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术，支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域，提供高效且逼真的视觉内容生成能力。

AI项目与工具 2025年06月12日 51 点赞 0 评论 613 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期