视频生成

Steamer

Steamer-I2V 是百度 Steamer 团队推出的图像到视频生成模型,能够将静态图像转化为动态视频,具备卓越的视觉生成能力。该模型基于 Transformer 扩散架构,支持多模态输入,包括中文文本提示和参考图像,实现像素级的画面控制与电影级构图效果。在 VBench 评测中荣获榜首,生成高清 1080P 视频,优化时间一致性与运动规律性,适用于广告、影视、游戏开发和内容创作等多个领域。

T2V

T2V-Turbo 是一种高效的文本到视频生成模型,能够快速生成高质量视频,同时确保文本与视频的高度一致性。它通过一致性蒸馏技术和混合奖励机制优化生成过程,适用于电影制作、新闻报道、教育及营销等多个领域,支持从创意草图到成品视频的全流程加速。

Higgsfield

Higgsfield是一款基于AI的视频生成平台,能够将文本提示转化为高质量视频内容,支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能,适用于社交媒体、广告及电影制作领域,提升创作效率与质量。

VIMI大模型

商汤科技推出的全球首个可控人物视频生成AIGC产品,VIMI模型基于商汤的日日新大模型技术,能够通过单张照片生成与目标动作一致的人物视频,实现精准的表情和肢体控制。

Emu Video

Meta开发的文本到视频生成模型,Emu Video使用扩散模型根据文本提示创建视频,首先生成图像,然后根据文本和生成的图像创建视频。

AutomateClips

AutomateClips是一款人工智能视频生成器,专为社交媒体平台如TikTok、Instagram和YouTube设计,以自动化创建吸引人的视频内容。

Kaiber

Kaiber是一个视频生成引擎,用户可以根据自己的图片或文字描述创建视频。它为音乐家提供了Spotify Canvas等功能,为艺术家提供了灵感,为创作者提供了内容,为未来主义者提供了乐...

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架,基于扩散变换器和3D面部几何先验,实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术,提升面部动态表现,同时保持身份稳定性。支持多种应用场景,如虚拟形象、内容创作和数字人交互,具备无需微调的高效生成能力。

Animate

Animate-X 是一个基于 Latent Diffusion Model 的通用动画框架,可将静态图像转化为高质量的动态视频,特别适合拟人化角色动画的生成。它通过引入隐式和显式姿势指示器,增强了对运动模式的捕捉能力,并支持多种角色类型,无需严格对齐。该工具在游戏开发、影视制作、虚拟现实及社交媒体内容创作等方面具有广泛应用价值。 ---