CogVideoX v1.5

简介：CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具，具备文本到视频生成、图像到视频转换等功能，支持高清视频输出及音效匹配。它通过三维变分自编码器（3D VAE）、Transformer架构等技术手段，提升了视频生成的质量与效率，适用于内容创作、广告营销、教育培训等多个领域。

AI小编 992 阅读 0 评论 19 点赞

项目地址

CogVideoX v1.5是由智谱推出的一款开源AI视频生成模型，包含两个主要版本：CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V。前者能够生成长度为5至10秒、分辨率为768P、包含16帧的高质量视频；后者则专注于图像到视频的转换，支持任意尺寸比例的处理。结合即将推出的CogSound音效模型，该工具还能生成与画面相匹配的音效，进一步提升视频的整体表现力。智谱AI已将此模型开源，并提供了GitHub和HuggingFace的访问路径。

本文分类：AI项目与工具
本文标签：AI视频生成开源模型文本到视频图像到视频高清视频音效匹配 Transformer架构三维变分自编码器内容创作广告营销
浏览次数：992 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10489.html

评论列表共有 0 条评论

暂无评论

CogVideoX v1.5

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复