视觉生成 - 智狐AI导航

PUMA

PUMA是一款先进的多模态大型语言模型，专注于通过整合多粒度视觉特征提升视觉生成与理解能力。它支持文本到图像生成、图像编辑、条件图像生成及多粒度视觉解码等功能，适用于艺术创作、媒体娱乐、广告营销等多个领域，凭借其强大的多模态预训练和微调技术，成为多模态AI领域的前沿探索。

AI项目与工具 2025年06月12日 72 点赞 0 评论 604 浏览

VARGPT

VARGPT是一款多模态大语言模型，整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制，支持文本与图像的混合输入和输出，具备高效的视觉生成能力。模型采用三阶段训练策略，提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 598 浏览

Unbounded

Unbounded是一款由谷歌与北卡罗来纳大学教堂山分校合作研发的无限人生模拟游戏，采用大型语言模型（LLM）和视觉生成模型，使玩家能够在开放世界中自由探索并引导角色互动，形成连贯的故事线。该工具具备实时动态生成游戏机制、角色个性化定制、视觉一致性维护等功能，同时适用于娱乐、教育、创意写作及心理治疗等多个领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 553 浏览

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型，支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略，实现从低分辨率到高分辨率的逐步生成，有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异，具备强大的语义理解和视觉表达能力。此外，PixelFlow采用端到端训练方式，支持多种ODE求解器，适用于艺术设计、内容创作、教育研究等多个领域。

AI项目与工具 2025年06月11日 100 点赞 0 评论 547 浏览

视觉生成

首页

视觉生成

列表

默认

浏览次数

发布日期

PUMA

VARGPT

Unbounded

PixelFlow

视觉生成 首页 视觉生成

列表 默认 浏览次数 发布日期

PUMA

VARGPT

Unbounded

PixelFlow

视觉生成

首页

视觉生成

列表

默认

浏览次数

发布日期