视频生成

商汤如影

商汤如影是一款由商汤科技开发的AI数字人视频生成平台,通过先进大模型技术创建高度逼真的数字人形象,应用于教育、金融、营销等领域。平台具备数字人创建、声音克隆、视频生成、自动化数据标注、图片生成、实时互动等功能,并支持多语言及多种服务形式,以满足个性化和专业化的服务需求。

Higgsfield

Higgsfield是一款基于AI的视频生成平台,能够将文本提示转化为高质量视频内容,支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能,适用于社交媒体、广告及电影制作领域,提升创作效率与质量。

SynCamMaster

SynCamMaster是一款由多家顶尖高校与企业联合研发的多视角视频生成工具,支持从任意视点生成高质量开放世界视频。其核心技术包括结合6自由度相机姿态、多视图同步模块以及预训练文本到视频模型的增强版本。SynCamMaster不仅能在不同视角间保持动态同步,还能实现新视角下的视频合成与渲染,广泛应用于影视制作、游戏开发、虚拟现实及监控系统等领域。

Vidgo AI

一个多合一AI图像、音乐和视频生成器,能将文字、图片等素材变成图像、音乐和视频等多媒体内容。提供AI 图像生成、视频生成和编辑三大核心功能。

VIMI大模型

商汤科技推出的全球首个可控人物视频生成AIGC产品,VIMI模型基于商汤的日日新大模型技术,能够通过单张照片生成与目标动作一致的人物视频,实现精准的表情和肢体控制。

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架,基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动,适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构,提升生成效果与稳定性,广泛应用于影视、游戏、教育、广告等领域。

Loopy

Loopy是一款由字节跳动开发的音频驱动的AI视频生成模型。该模型能够将静态照片转化为具有面部表情和头部动作的动态视频,与给定的音频文件同步。Loopy利用先进的扩散模型技术,无需额外的空间信号或条件,捕捉并学习长期运动信息,从而生成自然流畅的动作。其主要功能包括音频驱动、面部动作生成、无需额外条件以及长期运动信息捕捉。Loopy适用于娱乐、教育、影视制作等多种场景。

必火AI

必火AI是一款面向短视频创作的国产AI数字人工具,支持数字人形象生成、语音合成与视频制作等功能。用户上传3分钟真人视频即可生成高精度数字人形象,搭配丰富的音色库实现自然语音交互。平台提供多场景模板,适用于营销、教育、娱乐等多种用途,助力内容创作者高效生成高质量视频内容。

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型,能够生成长达10秒的高清视频片段,支持文本到视频、图像到视频的转换,并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情,提供运动画笔、高级相机控制和导演模式等高级控制工具,确保内容的安全性和合规性。