Open Open-Sora是一个开源视频生成模型,基于DiT架构,通过三个阶段的训练(大规模图像预训练、大规模视频预训练和高质量视频数据微调),生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT(Spatial-Temporal Diffusion Transformer)核心组件,利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程,供 AI项目与工具 2024年01月01日 97 点赞 0 评论 212 浏览
AIGC Cafe AIGC Cafe 是一个为AI爱好者和开发者设计的平台,提供多样化的AI模型,以促进学习和应用。这些模型覆盖了广泛的领域,包括但不限于图片灵感、国风、动漫、艺术风格、3D写实、自然... Ai绘画生成 1970年01月01日 0 点赞 0 评论 1 浏览