CogVideoX v1.5是由智谱推出的一款开源AI视频生成模型,包含两个主要版本:CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V。前者能够生成长度为5至10秒、分辨率为768P、包含16帧的高质量视频;后者则专注于图像到视频的转换,支持任意尺寸比例的处理。结合即将推出的CogSound音效模型,该工具还能生成与画面相匹配的音效,进一步提升视频的整体表现力。智谱AI已将此模型开源,并提供了GitHub和HuggingFace的访问路径。
CogVideoX v1.5是由智谱推出的一款开源AI视频生成模型,包含两个主要版本:CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V。前者能够生成长度为5至10秒、分辨率为768P、包含16帧的高质量视频;后者则专注于图像到视频的转换,支持任意尺寸比例的处理。结合即将推出的CogSound音效模型,该工具还能生成与画面相匹配的音效,进一步提升视频的整体表现力。智谱AI已将此模型开源,并提供了GitHub和HuggingFace的访问路径。
发表评论 取消回复