影视

通义万相AI视频

通义万相AI视频是一款基于人工智能的视频生成工具,支持文生视频和图生视频两种模式。用户可输入文字描述或上传图片生成高质量视频,支持多语言、多种艺术风格及音频生成功能,优化中式元素表现,广泛应用于影视、广告、动画设计等多个领域。

Tripo 2.0

Tripo 2.0 是一款基于 AI 技术的 3D 模型生成工具,融合了 DiT 和 U-Net 模型架构,具备高效生成高质量 3D 模型的能力。支持文本和图像输入生成 3D 模型,同时提供纹理贴图、负向提示输入等功能,广泛应用于游戏开发、影视制作、虚拟现实、教育及工业设计等领域。

豆包PixelDance

豆包PixelDance是一款由字节跳动开发的AI视频生成工具,基于DiT架构,支持文生视频和图生视频功能。它具备强大的语义理解能力,可生成长达10秒的连贯视频片段,并拥有丰富的运镜效果。该工具支持多种艺术风格和视频比例,适用于影视、广告、短视频等多种场景,极大简化了视频创作流程。

EzAudio

EzAudio是一款基于文本到音频(Text-to-Audio, T2A)生成模型,通过优化的扩散变换器架构和高效的数据训练策略,实现了快速生成高质量音频的功能。它支持多种应用场景,如音乐创作、影视后期制作、语音合成等,并具备高保真度和低资源消耗的特点。

BasedLabs

BasedLabs是一款基于AI技术的图像和视频创作平台,提供包括AI视频生成、图像创作、图像扩展及换脸在内的多种功能。用户可利用平台内置的AI模型生成高质量的视觉内容,适用于社交媒体、数字艺术、广告营销、影视制作、游戏开发以及教育培训等多个领域。平台操作简便,适合各类创作者使用。

Video Ocean

Video Ocean是一款基于AI技术的视频生成平台,主要功能包括文生视频、图生视频及角色生视频。它允许用户通过文本、图片或自定义角色生成高质量的视频内容,适用于多种应用场景如社交媒体营销、教育培训、影视制作等。此外,Video Ocean还注重提升视频的质量与细节,确保最终效果既美观又实用。

Matryoshka Diffusion Models

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的创新扩散模型,专为生成高分辨率图像和视频而设计。通过多尺度扩散机制与NestedUNet架构,MDM实现了高效的信息共享与渐进式训练,显著提升了模型的训练效率与生成质量。该模型适用于资源受限的环境,可减少训练步骤并保持生成图像的细节与清晰度。其主要功能包括高分辨率图像生成、多分辨率处理、特征共享以及渐进式训练

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱,支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能,采用传统图像处理与深度学习技术相结合的方式,提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。

PixVerse V3

PixVerse V3是一款由爱诗科技开发的AI视频生成工具,具备创意模板、口型匹配、风格转换等多模态生成能力。其核心功能包括精准的提示词理解、高质量视频生成、多种视频比例支持以及风格化功能升级。新增的口型适配功能和8个创意效果模板进一步丰富了应用场景,适用于社交媒体、广告营销、教育、影视及游戏开发等领域。

Animate

Animate-X 是一个基于 Latent Diffusion Model 的通用动画框架,可将静态图像转化为高质量的动态视频,特别适合拟人化角色动画的生成。它通过引入隐式和显式姿势指示器,增强了对运动模式的捕捉能力,并支持多种角色类型,无需严格对齐。该工具在游戏开发、影视制作、虚拟现实及社交媒体内容创作等方面具有广泛应用价值。 ---