自回归模型

FlexTok

FlexTok 是由EPFL与苹果联合开发的图像处理技术，通过将图像转为离散标记序列实现高效压缩与生成。支持8K视频实时渲染，压缩率提升300%，功耗降低45%。具备无损超分辨率重建和灵活图像生成能力，适用于智能家居、安防监控及移动设备等场景。

AI项目与工具 2025年06月12日 70 点赞 0 评论 408 浏览

VideoWorld

VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型，能够通过未标注视频数据学习复杂知识，包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型（LDM）和逆动态模型（IDM），支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异，且具备向自动驾驶、智能监控等场景扩展的潜力。

AI项目与工具 2025年06月12日 66 点赞 0 评论 550 浏览

MetaMorph

MetaMorph是一款基于多模态大模型的工具，通过Visual-Predictive Instruction Tuning（VPiT）技术实现文本和视觉token的生成。它在视觉理解和生成领域表现优异，能够克服其他生成模型的常见失败模式，同时有效处理专业术语和复杂语义问题。MetaMorph展示了统一建模方法的优势，支持多模态数据的高效处理，并在视觉生成与理解基准测试中取得竞争力表现。

AI项目与工具 2025年06月12日 53 点赞 0 评论 631 浏览

CausVid是一种由Adobe和MIT联合开发的实时视频生成技术，基于自回归生成模型和蒸馏预训练技术，实现了低延迟、高效率的视频创作。其核心功能包括即时视频生成、快速流式生成、零样本图像到视频转换、视频风格迁移、长视频生成以及交互式剧情生成等。CausVid通过分布匹配蒸馏、非对称蒸馏策略和滑动窗口机制等技术手段，优化了视频生成的质量与稳定性，适用于内容创作、新闻报道、教育培训、游戏开发及广告营

AI项目与工具 2025年06月12日 80 点赞 0 评论 687 浏览

Llama 3.3

Llama 3.3是一款由Meta AI开发的70B参数大型多语言预训练语言模型，支持英语、德语、法语等8种语言的输入输出。它具备长上下文窗口、高效运行和低成本的特点，可与第三方工具集成，广泛应用于聊天机器人、客户服务、语言翻译、内容创作及教育等领域。

AI项目与工具 2025年06月12日 71 点赞 0 评论 766 浏览

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型，能够生成1024×1024像素的高分辨率图像，质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块，HART实现了高效的图像生成，并在多个指标上表现出色，包括重构FID、生成FID以及计算效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 513 浏览

Time

Time-MoE是一种基于混合专家架构的时间序列预测模型，通过稀疏激活机制提高计算效率并降低成本。该模型支持任意长度的输入和输出，能够在多个领域实现高精度的时序预测。经过大规模数据集Time-300B的预训练，Time-MoE展现出卓越的泛化能力和多任务适应性，广泛应用于能源管理、金融预测、电商销量分析、气象预报以及交通规划等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 722 浏览

PUMA

PUMA是一款先进的多模态大型语言模型，专注于通过整合多粒度视觉特征提升视觉生成与理解能力。它支持文本到图像生成、图像编辑、条件图像生成及多粒度视觉解码等功能，适用于艺术创作、媒体娱乐、广告营销等多个领域，凭借其强大的多模态预训练和微调技术，成为多模态AI领域的前沿探索。

AI项目与工具 2025年06月12日 72 点赞 0 评论 487 浏览

Loong

Loong是一种基于自回归大型语言模型的长视频生成工具，能够生成长达一分钟以上的高质量视频。其核心技术包括统一序列建模、渐进式训练方法及损失重新加权策略，确保生成视频在内容连贯性、动态丰富性和场景过渡上的卓越表现。Loong广泛适用于娱乐、教育、广告等多个领域，助力用户快速生成个性化、专业化的视频内容。

AI项目与工具 2025年06月12日 60 点赞 0 评论 518 浏览

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架，专为长视频设计。该框架结合自回归模型和扩散渲染技术，生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本，适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

AI项目与工具 2025年06月12日 34 点赞 0 评论 628 浏览

自回归模型

首页

自回归模型

列表

默认

浏览次数

发布日期