VQGAN

首页

VQGAN

列表

默认

浏览次数

发布日期

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架，通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间，使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本，提升视觉生成与理解性能，并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用，适用于创意设计、内容创作及智能交互等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 604 浏览

VQGAN 首页 VQGAN

列表 默认 浏览次数 发布日期

Liquid

VQGAN

首页

VQGAN

列表

默认

浏览次数

发布日期