视觉生成 - 智狐AI导航

VARGPT

VARGPT是一款多模态大语言模型，整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制，支持文本与图像的混合输入和输出，具备高效的视觉生成能力。模型采用三阶段训练策略，提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 477 浏览

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架，采用“下一个X预测”和“噪声上下文学习”技术，提升视觉生成的准确性和效率。其支持多种预测单元，具备高性能生成能力，在ImageNet数据集上表现优异，适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 469 浏览

Unbounded

Unbounded是一款由谷歌与北卡罗来纳大学教堂山分校合作研发的无限人生模拟游戏，采用大型语言模型（LLM）和视觉生成模型，使玩家能够在开放世界中自由探索并引导角色互动，形成连贯的故事线。该工具具备实时动态生成游戏机制、角色个性化定制、视觉一致性维护等功能，同时适用于娱乐、教育、创意写作及心理治疗等多个领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 436 浏览

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型，支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略，实现从低分辨率到高分辨率的逐步生成，有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异，具备强大的语义理解和视觉表达能力。此外，PixelFlow采用端到端训练方式，支持多种ODE求解器，适用于艺术设计、内容创作、教育研究等多个领域。

AI项目与工具 2025年06月11日 100 点赞 0 评论 413 浏览

视觉生成

首页

视觉生成

列表

默认

浏览次数

发布日期

VARGPT

xAR

Unbounded

PixelFlow

视觉生成 首页 视觉生成

列表 默认 浏览次数 发布日期

VARGPT

xAR

Unbounded

PixelFlow

视觉生成

首页

视觉生成

列表

默认

浏览次数

发布日期