Wan2.1是阿里云推出的一款开源AI视频生成大模型,具备强大的视觉生成能力。该模型支持文本生成视频和图像生成视频两种任务,并提供两种版本:14B参数的专业版适用于复杂运动与物理建模,性能优异;1.3B参数的极速版可在消费级显卡上运行,适合二次开发与学术研究。Wan2.1基于因果3D VAE和视频Diffusion Transformer架构,实现高效的时空压缩与长时程依赖建模。在权威评测集Vbench中,其14B版本以总分86.22%的成绩超越Sora、Luma、Pika等主流模型,表现突出。项目采用Apache 2.0协议开放,已在GitHub、HuggingFace及魔搭社区上线,便于开发者使用与部署。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部