扩散模型 - 智狐AI导航

FabricDiffusion

FabricDiffusion是一项由谷歌与卡内基梅隆大学联合开发的高保真3D服装生成技术，可将2D服装图像的纹理和印花高质量地转移到3D服装模型上。其核心技术基于去噪扩散模型和大规模合成数据集，生成多种纹理贴图并支持跨光照条件的精准渲染，具备优秀的泛化能力和实际应用潜力，适用于虚拟试衣、游戏开发、影视制作及时尚设计等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 705 浏览

MagicQuill

MagicQuill是一款基于AI的开源图像编辑工具，提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑（如添加、删除和颜色调整），以及多种定制化工具（如添加笔刷、减去笔刷和颜色笔刷）。此外，它还具备实时意图预测和参数调整能力，支持多模态大语言模型和扩散模型的协作，适用于个人娱乐、教育、专业设计及商业应用等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 716 浏览

DanceFusion

DanceFusion是一款由清华大学开发的开源框架，专注于音频驱动的舞蹈动作生成与重建。它采用分层时空Transformer-VAE和扩散模型，能够处理不完整或嘈杂的数据，生成与音乐高度同步的逼真舞蹈动作。该工具支持多种应用场景，包括内容创作、虚拟现实、互动娱乐、舞蹈教育以及动画制作等，展现了其在多领域的应用价值。

AI项目与工具 2025年06月12日 86 点赞 0 评论 711 浏览

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具，专为多模态眼科图像生成设计。通过自然语言提示，EyeDiff能够捕捉常见及罕见眼病的关键特征，显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制，结合潜在扩散模型（LDM），生成高质量、与文本高度一致的图像，适用于数据增强、疾病筛查、数据共享及医学教育等场景。

AI项目与工具 2025年06月12日 89 点赞 0 评论 600 浏览

ReCapture

ReCapture是一种先进的视频处理技术，由谷歌与新加坡国立大学联合研发。它通过多视图扩散模型和点云渲染生成新视角视频，同时使用掩码视频微调技术优化视频质量，保留场景运动并补全不可见部分，广泛应用于电影制作、视频编辑、虚拟现实及新闻报道等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 490 浏览

JoyVASA

JoyVASA是一个基于扩散模型的音频驱动数字人头项目，能够生成与音频同步的面部动态和头部运动。其主要功能包括唇形同步、表情控制及动物面部动画生成，支持多语言和跨物种动画化。项目采用两阶段训练方法，结合解耦面部表示与扩散模型技术，生成高质量动画视频，广泛应用于虚拟助手、娱乐媒体、教育、广告等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 829 浏览