扩散模型 - 智狐AI导航

IDM

IDM-VTON是一种基于改进扩散模型的先进AI虚拟试穿技术，由韩国科学技术院和OMNIOUS.AI的研究人员共同开发。该技术利用视觉编码器提取服装的高级语义信息，并通过GarmentNet捕捉服装的低级细节特征，从而生成逼真的人物穿戴图像。IDM-VTON支持文本提示理解，实现了个性化定制和逼真的试穿效果，广泛应用于电子商务、时尚零售、个性化推荐、社交媒体以及时尚设计等领域。

AI项目与工具 2024年01月01日 49 点赞 0 评论 463 浏览

PixelHacker

PixelHacker是一款由华中科技大学与VIVO AI Lab联合开发的图像修复模型，采用潜在类别引导机制，通过线性注意力实现结构与语义一致性的高质量修复。基于大规模数据集训练并经过多基准微调，支持多种图像类型与分辨率。适用于照片修复、对象移除、艺术创作、医学影像及文化保护等领域。

AI项目与工具 2025年06月11日 50 点赞 0 评论 462 浏览

DiffSensei是一款由北京大学、上海AI实验室及南洋理工大学联合开发的漫画生成框架，它结合了基于扩散的图像生成技术和多模态大型语言模型（MLLM）。该工具能够根据用户提供的文本提示和角色图像，生成具有高精度和视觉吸引力的黑白漫画面板，支持多角色场景下的互动与布局调整。其核心技术包括掩码交叉注意力机制、对话布局编码以及MLLM作为特征适配器等，广泛应用于漫画创作、个性化内容生成、教育和培训等领

AI项目与工具 2025年06月12日 47 点赞 0 评论 460 浏览

Add

Add-it是一款无需训练的图像编辑工具，允许用户通过文本指令在图像中插入新对象。其核心功能包括保持场景结构一致性、确保对象自然融合、支持非真实感图像处理等。Add-it采用扩展的注意力机制和主题引导潜在混合技术，无需额外训练即可实现高质量图像编辑。广泛适用于广告、内容创作、影视制作等领域。

AI项目与工具 2025年06月12日 30 点赞 0 评论 459 浏览

混元DiT

混元DiT（Hunyuan-DiT）是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器，通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外，混元DiT在

AI项目与工具 2024年01月01日 64 点赞 0 评论 458 浏览

EasyControl Ghibli

EasyControl Ghibli 是一款基于扩散模型的 AI 工具，专注于将普通图像转换为吉卜力风格，具备风格迁移、面部特征保留、高效运行等优点。它通过少量数据训练即可生成高质量图像，适用于插画、动画、广告及个人照片风格化等多种场景。用户可免费使用，操作便捷，适合艺术创作与内容生成需求。

AI项目与工具 2025年06月12日 40 点赞 0 评论 457 浏览

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具，专为多模态眼科图像生成设计。通过自然语言提示，EyeDiff能够捕捉常见及罕见眼病的关键特征，显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制，结合潜在扩散模型（LDM），生成高质量、与文本高度一致的图像，适用于数据增强、疾病筛查、数据共享及医学教育等场景。

AI项目与工具 2025年06月12日 89 点赞 0 评论 456 浏览

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具，能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导，确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域，显著提升了3D内容生成的效率和质量。

AI项目与工具 2025年06月12日 27 点赞 0 评论 456 浏览

HoloPart

HoloPart 是一种基于扩散模型的 3D 分割工具，能准确识别并补全被遮挡的语义部件，支持几何与材质编辑等任务。其两阶段方法结合局部与全局注意力机制，提升分割精度与一致性。适用于动画制作、几何优化及数据生成等领域，已在多个数据集上取得优异性能。

AI项目与工具 2025年06月11日 84 点赞 0 评论 455 浏览

LanDiff

LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架，采用粗到细的生成策略，有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成，降低计算成本，适用于视频制作、VR/AR、教育及社交媒体等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 452 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期

IDM