自回归模型

PUMA是一款先进的多模态大型语言模型，专注于通过整合多粒度视觉特征提升视觉生成与理解能力。它支持文本到图像生成、图像编辑、条件图像生成及多粒度视觉解码等功能，适用于艺术创作、媒体娱乐、广告营销等多个领域，凭借其强大的多模态预训练和微调技术，成为多模态AI领域的前沿探索。

AI项目与工具 2025年06月12日 72 点赞 0 评论 604 浏览

MAGI-1是一款由Sand AI开发的开源视频生成大模型，采用自回归架构，支持高效、高质量的视频生成，具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域，技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法，提升生成效率与稳定性。

AI项目与工具 2025年06月11日 37 点赞 0 评论 594 浏览

FlexTok 是由EPFL与苹果联合开发的图像处理技术，通过将图像转为离散标记序列实现高效压缩与生成。支持8K视频实时渲染，压缩率提升300%，功耗降低45%。具备无损超分辨率重建和灵活图像生成能力，适用于智能家居、安防监控及移动设备等场景。

AI项目与工具 2025年06月12日 70 点赞 0 评论 554 浏览

自回归模型

首页

自回归模型