扩散模型 - 智狐AI导航

LVCD

LVCD是一款基于视频扩散模型的AI工具，专门用于动画视频线稿的自动上色。它通过参考注意力机制和创新的采样方法，确保视频颜色的一致性和时间连贯性，支持生成长时间序列动画。LVCD广泛应用于动漫制作、游戏开发、影视行业以及艺术创作等领域，显著提升动画制作效率。

AI项目与工具 2025年06月12日 98 点赞 0 评论 728 浏览

SPAR3D

SPAR3D是一种基于两阶段设计的单图像3D重建工具，能从单张2D图像生成高质量的3D网格。它结合点扩散模型与三平面Transformer技术，实现快速、精确的几何与纹理重建，并支持用户交互式编辑。适用于增强现实、影视制作、工业设计等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 730 浏览

PartGen

PartGen是一款基于多视图扩散模型的3D对象生成与重建工具，可从文本、图像或现有3D模型生成由意义明确部分组成的三维对象。它具备自动部分分割、3D重建及基于文本指令的部分编辑等功能，广泛应用于3D打印、游戏开发、影视制作等领域，显著提升工作效率并优化用户体验。

AI项目与工具 2025年06月12日 74 点赞 0 评论 735 浏览

CogView4

CogView4是一款由智谱推出的开源文生图模型，具有60亿参数，支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异，达到当前开源模型的领先水平。模型具备强大的语义理解能力，尤其在中文文字生成方面表现突出，适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer，并采用显存优化技术提升推理效率。

AI项目与工具 2025年06月12日 83 点赞 0 评论 736 浏览

DiffSplat

DiffSplat是一款高效的3D生成工具，能够根据文本或图像快速生成高质量的3D高斯点云。它基于预训练的文本到图像扩散模型，结合2D先验知识和3D渲染损失机制，确保生成内容在多视角下保持一致。支持文本、图像或组合输入，具备可控生成能力，适用于3D内容创作、图像重建及多种下游应用。

AI项目与工具 2025年06月12日 72 点赞 0 评论 737 浏览

SNOOPI

SNOOPI是一种基于增强单步扩散模型的文本到图像生成框架，通过PG-SB和NASA技术提高了模型的稳定性和控制力。它在多方面表现出色，包括提高生成效率、排除不期望的图像元素、支持多种模型背板以及生成高质量图像。SNOOPI广泛应用于数字艺术、游戏开发、广告、社交媒体和影视等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 737 浏览

ICEdit

ICEdit是由浙江大学与哈佛大学联合开发的指令式图像编辑框架，基于扩散变换器实现自然语言驱动的图像修改。支持多轮编辑、风格转换、对象替换等功能，具有高效处理能力（单张图像约9秒）。采用LoRA-MoE混合微调策略，降低资源需求，适用于创意设计、影视制作、社交媒体等多个领域。开源且提供在线体验，便于研究与应用。

AI项目与工具 2025年06月11日 85 点赞 0 评论 738 浏览

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型，能够根据文本描述精准生成高质量、高分辨率图像，支持多种纵横比输出。具备优秀的人物与物体渲染能力，适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成，单次最多输出 9 张图像，每分钟处理 10 个请求，提升创作效率。采用扩散模型与 Transformer 架构，结合线性注意力与 MoE 技术，确保图像质量与生成效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 738 浏览

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型，支持实时交互与动态世界生成，确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠，有效解决多人游戏中的同步难题。模型训练成本低，可在普通PC上运行，且项目全面开源，适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 738 浏览

CorrDiff

CorrDiff是NVIDIA开发的生成式AI模型，用于将低分辨率天气数据提升至高分辨率，提升天气预测的精度和效率。采用UNet与扩散模型结合的两步法，显著提升计算速度并降低能耗。支持多变量预测和极端天气模拟，适用于灾害预警和高精度气象分析，具备良好的部署灵活性。

AI项目与工具 2025年06月12日 87 点赞 0 评论 741 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期