VAE - 智狐AI导航

Direct3D

Direct3D-S2是由南京大学、DreamTech、复旦大学和牛津大学联合开发的高分辨率3D生成框架，基于稀疏体积表示和空间稀疏注意力（SSA）机制，提升扩散变换器（DiT）的计算效率并降低训练成本。该框架包含全端到端的稀疏SDF变分自编码器（SS-VAE），支持多分辨率训练，在1024³分辨率下仅需8个GPU即可训练。Direct3D-S2能够从图像生成高分辨率3D形状，具有精细几何细节和高

AI项目与工具 2025年06月11日 23 点赞 0 评论 756 浏览

淘宝星辰

淘宝星辰是阿里妈妈推出的电商视频生成大模型，支持图片或文本指令生成高质量视频。具备智能商品展示、多语种语义理解、物理动作逻辑遵循及元素稳定性保障等功能，适用于商品主图、卖点展示、种草内容及虚拟试穿等场景，有效提升商品吸引力和转化效率。

AI项目与工具 2025年06月12日 73 点赞 0 评论 752 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 739 浏览

万相首尾帧模型

万相首尾帧模型（Wan2.1-FLF2V-14B）是一款开源视频生成工具，基于DiT架构和交叉注意力机制，可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效，适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能，且提供GitHub和HuggingFace开源资源供用户使用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 724 浏览

DanceFusion

DanceFusion是一款由清华大学开发的开源框架，专注于音频驱动的舞蹈动作生成与重建。它采用分层时空Transformer-VAE和扩散模型，能够处理不完整或嘈杂的数据，生成与音乐高度同步的逼真舞蹈动作。该工具支持多种应用场景，包括内容创作、虚拟现实、互动娱乐、舞蹈教育以及动画制作等，展现了其在多领域的应用价值。

AI项目与工具 2025年06月12日 86 点赞 0 评论 711 浏览

Index

Index-AniSora是由哔哩哔哩开发的动漫视频生成模型，支持多种动画风格的生成，涵盖番剧、国创、VTuber等内容。其核心技术包括扩散模型、时空掩码模块和Transformer架构，具备图像到视频生成、帧插值、局部引导等能力。模型提供高质量数据集，适用于动画制作、创意验证、教育及营销等多个领域。

AI项目与工具 2025年06月11日 32 点赞 0 评论 685 浏览

HunyuanVideo

HunyuanVideo是一款由腾讯开源的视频生成模型，具备130亿参数量，支持物理模拟、高文本语义还原、动作一致性和电影级画质等功能。它通过时空压缩的潜在空间训练，融合Causal 3D VAE与Transformer架构，实现图像和视频的统一生成，广泛应用于电影制作、音乐视频创作、游戏开发以及教育等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 678 浏览

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 657 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 633 浏览

UniFluid

UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架，支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入，结合Gemma模型和VAE技术，实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色，具备良好的下游任务迁移能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 614 浏览

VAE

首页

VAE

列表

默认

浏览次数

发布日期