视频生成

CustomVideoX

CustomVideoX是一种基于视频扩散变换器的个性化视频生成框架,能够根据参考图像和文本描述生成高质量视频。其核心技术包括3D参考注意力机制、时间感知注意力偏差(TAB)和实体区域感知增强(ERAE),有效提升视频的时间连贯性和语义一致性。支持多种应用场景,如艺术设计、广告营销、影视制作等,具备高效、精准和可扩展的特点。

渗透智能

一款全方位AI产品,集成问答+绘画+导图+PDF对话等功能!

ssemble

Ssemble 是一款利用人工智能技术的在线视频编辑平台,专注于将长视频自动分割为短视频内容,适用于社交媒体营销、内容创作、教育培训和产品推广等多种场景。其核心功能包括智能片段提取、多模板选择、自动过渡效果及多语言支持,显著提升了视频创作的效率和质量。

ChatAnyone

ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具,基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型,支持实时交互与风格化控制,适用于虚拟主播、视频会议、内容创作等多种场景,具备高度可扩展性和实用性。

Deforum

一款开源免费软件工具,一种基于Stable Diffusion的动画生成工具,它可以根据文本描述或参考视频生成连续的图像序列,并将它们拼接在一起以创建视频。

DisPose

DisPose是一项由多家顶尖高校联合研发的技术,专注于优化人物图像动画的质量。它通过运动场引导和关键点对应的方式,结合混合ControlNet模块,实现了对骨骼姿态的有效控制,无需额外密集输入即可生成高质量、一致性的动画视频。DisPose广泛适用于艺术创作、社交媒体、数字人制作及虚拟现实等领域。

Vidu Q1

Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型,支持1080p高清视频生成,具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异,包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构,融合文本、图像和视频信息,适用于影视制作、广告宣传及动画创作等领域。

VideoWorld

VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型,能够通过未标注视频数据学习复杂知识,包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型(LDM)和逆动态模型(IDM),支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异,且具备向自动驾驶、智能监控等场景扩展的潜力。

Vidu 1.5

Vidu 1.5是一款基于多模态视频大模型的AI生成工具,支持参考生视频、图生视频和文生视频生成,通过精准的语义理解能力,在30秒内完成高质量视频创作,适用于影视、动漫、广告等多行业场景,助力创作者高效产出多样化内容。

Haiper.ai

Haiper.ai 是一家位于伦敦国王十字区的AI研究和产品公司,专注于开发视频创作AI产品。