视频生成

DiTCtrl

DiTCtrl是一种基于多模态扩散变换器架构的视频生成工具,能够利用多个文本提示生成连贯且高质量的视频内容,无需额外训练即可实现零样本多提示视频生成。它通过KV共享和潜在混合策略优化不同提示间的平滑过渡,同时在MPVBench基准上表现出色,适用于电影、游戏、广告及新闻等多个领域。

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

Mora

Mora是一个多智能体框架,专为视频生成任务设计,通过多个视觉智能体的协作实现高质量视频内容的生成。主要功能包括文本到视频生成、图像到视频生成、视频扩展与编辑、视频到视频编辑以及视频连接。尽管在处理大量物体运动场景时性能稍逊于Sora,Mora仍能在生成高分辨率视频方面表现出色。

可灵AI国际版(Kling AI)

Kling AI国际版是快手推出的AI创意工具,支持图像、视频及声音的生成与编辑。用户可通过文本或图像输入生成内容,并利用AI模板、虚拟模特、换装及对口型等功能进行创作。适用于内容创作、教育、电商及社交等多个领域,提升创作效率与表现力。

BlockDance

BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术,通过识别结构相似的时空特征(STSS)减少冗余计算,提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配,平衡速度与质量。适用于图像、视频生成及实时应用,支持多种模型,兼顾高效与高质,适用于资源受限环境。

I2V3D

I2V3D是一款由香港城市大学与微软GenAI合作开发的图像到视频生成工具,支持将静态图像转换为高质量动态视频。其核心在于结合传统CG管线与生成式AI技术,采用两阶段生成流程实现精准的3D动画控制,支持复杂场景编辑和灵活的视频生成,适用于动画制作、视频创作及教育等多个领域。

Visla

Visla的AI视频生成器为用户提供了一个强大的工具,可以轻松地将各种内容转换成视频,无需专业的视频编辑技能。

PlaiDay

PlaiDay和Orchestra平台展现了AI技术在个性化内容生成和其他领域的潜力,为用户提供了一个易于使用且功能强大的视频创作环境。

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法,专注于提升AI生成视频的质量,特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化,无需额外训练即可高效提升视频效果,适用于视频创作、学术研究、在线平台等多个领域。

PixVerse V3.5

PixVerse V3.5是一款基于AI技术的视频生成工具,具备超高速视频生成、动漫效果自定义、高清画质输出及首尾帧平滑过渡等功能。它通过优化运动控制和细节表现,为用户提供流畅且精准的视频制作体验,适用于社交媒体内容创作及各类节日主题视频设计。