视频生成

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架,支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计,能够快速生成高质量图像并提升推理效率。

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架,支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器,能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作,适用于娱乐、广告、教育等多个领域。

Plazmapunk

PlazmaPunk 是一个旨在帮助用户轻松创建定制化的音乐生成视频的ai工具。用户通过PlazmaPunk 上传自己的音乐文件,并根据用户选择的风格自动生成定制的视频内容。

元镜AI短视频创作平台

一个可以通过输入文字就可以自动生成视频的工具,元镜可以自动生成视频脚本和分镜,一键生成短视频,视频时长可这60S。

Symphony Creative Studio

Symphony Creative Studio是一款由TikTok开发的AI视频创作工具,专注于简化广告主和内容创作者的视频制作流程。它具备视频生成、转换、扩展以及虚拟人物创作等功能,支持多语言翻译与配音,并可基于品牌IP定制虚拟形象。通过整合多种智能技术,该工具显著提升了内容创作效率与质量。

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段,生成高度可控且逼真的动画,保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异,适用于虚拟现实、游戏、人机交互等多个领域。

Viggle

Viggle是一个强大的AI视频生成工具,它通过易于使用的命令为用户提供了丰富的视频创作可能性。无论是将静态角色转化为动态视频,还是完全控制角色动作,Viggle都能满足用户的创意...

Genmoai

Genmoai-smol 是一款专为单 GPU 设备设计的开源视频生成模型,能够将文本描述转化为高质量视频内容。其核心优势在于高保真度运动表现、强大的文本提示遵循能力及显存优化技术,支持用户在资源受限条件下开展视频创作。该工具提供了 Gradio UI 和命令行界面两种操作方式,并广泛应用于视频内容创作、超现实效果视频制作和技术研究等领域。

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具,可生成高质量、自然的说话人头部视频。支持多信号控制(如音频、表情),采用并行 Mamba 结构和门控机制,实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异,适用于虚拟主播、远程会议、在线教育等多种场景。

Lumen5

Lumen5是一个在线视频创建者,允许团队中的任何人快速轻松地创建引人入胜的视频内容。它以人工智能技术为特色,重新利用营销内容,可定制的模板旨在帮助保持品牌,预算和时间,以...