生成模型 - 智狐AI导航

S2V

S2V-01是MiniMax研发的视频生成模型，基于单图主体参考架构，可快速生成高质量视频。它能精准还原图像中的面部特征，保持角色一致性，并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出，具备电影感镜头效果，适用于短视频、广告、游戏、教育等多种场景，具有高效、稳定和高自由度的特点。

AI项目与工具 2025年06月12日 100 点赞 0 评论 515 浏览

Video Alchemist是一款由Snap公司研发的视频生成模型，支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块，通过文本提示和参考图像生成视频内容，无需测试优化。模型引入自动数据构建和图像增强技术，提升主体识别能力。同时，研究团队提出MSRVTT-Personalization基准，用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

AI项目与工具 2025年06月12日 26 点赞 0 评论 559 浏览

VideoWorld

VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型，能够通过未标注视频数据学习复杂知识，包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型（LDM）和逆动态模型（IDM），支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异，且具备向自动驾驶、智能监控等场景扩展的潜力。

AI项目与工具 2025年06月12日 66 点赞 0 评论 550 浏览

VideoJAM

VideoJAM是Meta开发的视频生成框架，旨在提升视频运动连贯性。通过联合学习外观与运动信息，在训练阶段同时预测像素和运动特征，并在推理阶段利用动态引导机制优化生成结果。该技术具备高度通用性，可适配多种视频生成模型，无需调整训练数据或模型结构，已在多项基准测试中表现优异，适用于影视、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 533 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 756 浏览

PIKE

PIKE-RAG是由微软亚洲研究院开发的检索增强型生成框架，旨在提升复杂工业场景下的问答准确性与推理能力。通过知识原子化、多智能体规划等技术，支持多跳问题处理和创造性问题解决。适用于法律、医疗、金融等多个领域，具备结构化知识提取、动态任务分解及分阶段开发等核心功能，提高模型生成结果的可靠性和实用性。

AI项目与工具 2025年06月12日 72 点赞 0 评论 763 浏览

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型，支持文生视频与图生视频，具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构，性能卓越，尤其在Vbench评测中表现领先。提供专业版与极速版，适应不同场景需求，已开源并支持多种框架，便于开发与研究。

AI项目与工具 2025年06月12日 47 点赞 0 评论 508 浏览

ViDoRAG

ViDoRAG是阿里巴巴通义实验室联合高校开发的视觉文档检索增强生成框架，采用多智能体协作与动态迭代推理技术，提升复杂文档的检索与理解能力。通过高斯混合模型优化多模态信息整合，支持精准检索与高质量生成，适用于教育、金融、医疗等多个领域，显著提升文档处理效率与准确性。

AI项目与工具 2025年06月12日 26 点赞 0 评论 677 浏览

Fractal Generative Models

Fractal Generative Models 是一种基于分形架构的图像生成技术，通过递归调用“原子模块”实现逐像素生成高分辨率图像。该模型结合 Transformer 模块，采用分而治之策略，大幅提升计算效率。不仅适用于图像生成，还可扩展至分子结构、蛋白质等高维数据建模，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 630 浏览

NotaGen

NotaGen 是由多所高校联合研发的音乐生成模型，基于预训练、微调和强化学习技术，可生成高质量古典乐谱。支持通过“时期-作曲家-乐器”等条件控制音乐风格，具备高度音乐性与可控性。采用 CLaMP-DPO 方法优化生成质量，无需人工标注。适用于音乐创作、教育、影视配乐等多种场景，提供多种模型规模选择，满足不同需求。

AI项目与工具 2025年06月12日 66 点赞 0 评论 755 浏览

生成模型

首页

生成模型

列表

默认

浏览次数

发布日期

S2V

Video Alchemist