自回归模型

Voicebox

Voicebox 是由 Meta AI 研究团队开发的一款领先的语音生成模型。Voicebox 能够在六种语言中合成语音，消除瞬态噪声，编辑内容，在语言之间转移音频风格，并生成多样的语音样本。此...

创作工具 2026年06月27日 0 点赞 0 评论 770 浏览

Seed Music

一个强大的音乐生成工具，它通过先进的技术手段，如自回归模型和扩散模型，为用户提供了从音乐创作到编辑再到声音转换的全方位服务。这套系统不仅能够生成高质量的音乐作品，还能...

创作工具 2026年06月27日 0 点赞 0 评论 655 浏览

Grok

Grok-1是由xAI公司开发的大型语言模型，具备3140亿参数，是目前参数量最大的开源大语言模型之一。该模型基于Transformer架构，专用于自然语言处理任务，如问答、信息检索、创意写作和编码辅助等。尽管在信息处理方面表现出色，但需要人工审核以确保准确性。此外，Grok-1还提供了8bit量化版本，以降低存储和计算需求。

AI项目与工具 2024年01月01日 10 点赞 0 评论 685 浏览

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架，专为长视频设计。该框架结合自回归模型和扩散渲染技术，生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本，适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

AI项目与工具 2025年06月12日 34 点赞 0 评论 703 浏览

Loong

Loong是一种基于自回归大型语言模型的长视频生成工具，能够生成长达一分钟以上的高质量视频。其核心技术包括统一序列建模、渐进式训练方法及损失重新加权策略，确保生成视频在内容连贯性、动态丰富性和场景过渡上的卓越表现。Loong广泛适用于娱乐、教育、广告等多个领域，助力用户快速生成个性化、专业化的视频内容。

AI项目与工具 2025年06月12日 60 点赞 0 评论 592 浏览

PUMA

PUMA是一款先进的多模态大型语言模型，专注于通过整合多粒度视觉特征提升视觉生成与理解能力。它支持文本到图像生成、图像编辑、条件图像生成及多粒度视觉解码等功能，适用于艺术创作、媒体娱乐、广告营销等多个领域，凭借其强大的多模态预训练和微调技术，成为多模态AI领域的前沿探索。

AI项目与工具 2025年06月12日 72 点赞 0 评论 552 浏览

Time

Time-MoE是一种基于混合专家架构的时间序列预测模型，通过稀疏激活机制提高计算效率并降低成本。该模型支持任意长度的输入和输出，能够在多个领域实现高精度的时序预测。经过大规模数据集Time-300B的预训练，Time-MoE展现出卓越的泛化能力和多任务适应性，广泛应用于能源管理、金融预测、电商销量分析、气象预报以及交通规划等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 800 浏览

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型，能够生成1024×1024像素的高分辨率图像，质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块，HART实现了高效的图像生成，并在多个指标上表现出色，包括重构FID、生成FID以及计算效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 588 浏览

Llama 3.3

Llama 3.3是一款由Meta AI开发的70B参数大型多语言预训练语言模型，支持英语、德语、法语等8种语言的输入输出。它具备长上下文窗口、高效运行和低成本的特点，可与第三方工具集成，广泛应用于聊天机器人、客户服务、语言翻译、内容创作及教育等领域。

AI项目与工具 2025年06月12日 71 点赞 0 评论 842 浏览

CausVid是一种由Adobe和MIT联合开发的实时视频生成技术，基于自回归生成模型和蒸馏预训练技术，实现了低延迟、高效率的视频创作。其核心功能包括即时视频生成、快速流式生成、零样本图像到视频转换、视频风格迁移、长视频生成以及交互式剧情生成等。CausVid通过分布匹配蒸馏、非对称蒸馏策略和滑动窗口机制等技术手段，优化了视频生成的质量与稳定性，适用于内容创作、新闻报道、教育培训、游戏开发及广告营

AI项目与工具 2025年06月12日 80 点赞 0 评论 758 浏览

自回归模型

首页

自回归模型

列表

默认

浏览次数

发布日期