σ-VAE

首页

σ-VAE

列表

默认

浏览次数

发布日期

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 555 浏览

σ-VAE 首页 σ-VAE

列表 默认 浏览次数 发布日期

LatentLM

σ-VAE

首页

σ-VAE

列表

默认

浏览次数

发布日期