扩散模型 - 智狐AI导航

PartGen

PartGen是一款基于多视图扩散模型的3D对象生成与重建工具，可从文本、图像或现有3D模型生成由意义明确部分组成的三维对象。它具备自动部分分割、3D重建及基于文本指令的部分编辑等功能，广泛应用于3D打印、游戏开发、影视制作等领域，显著提升工作效率并优化用户体验。

AI项目与工具 2025年06月12日 74 点赞 0 评论 728 浏览

SPAR3D

SPAR3D是一种基于两阶段设计的单图像3D重建工具，能从单张2D图像生成高质量的3D网格。它结合点扩散模型与三平面Transformer技术，实现快速、精确的几何与纹理重建，并支持用户交互式编辑。适用于增强现实、影视制作、工业设计等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 727 浏览

LVCD

LVCD是一款基于视频扩散模型的AI工具，专门用于动画视频线稿的自动上色。它通过参考注意力机制和创新的采样方法，确保视频颜色的一致性和时间连贯性，支持生成长时间序列动画。LVCD广泛应用于动漫制作、游戏开发、影视行业以及艺术创作等领域，显著提升动画制作效率。

AI项目与工具 2025年06月12日 98 点赞 0 评论 725 浏览

GCDance

GCDance是一款由英国萨里大学与江南大学联合开发的3D舞蹈生成框架，可根据音乐和文本提示生成风格可控的全身舞蹈序列。它结合多粒度音乐特征融合与CLIP模型文本嵌入技术，实现舞蹈动作与音乐节奏的高度同步。支持多种舞蹈风格生成、局部编辑及高质量全身动作输出，适用于VR、游戏开发、舞蹈教学等场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 723 浏览

Diffutoon

Diffutoon是一款基于扩散模型的AI框架，旨在将现实风格的视频转换为动漫风格。该框架支持高分辨率视频处理，能够实现风格化、一致性增强、结构引导和自动着色等功能。此外，Diffutoon具备内容编辑功能，用户可通过文本提示调整视频细节，确保视觉效果和内容的一致性。

AI项目与工具 2025年06月12日 45 点赞 0 评论 720 浏览

MagicQuill

MagicQuill是一款基于AI的开源图像编辑工具，提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑（如添加、删除和颜色调整），以及多种定制化工具（如添加笔刷、减去笔刷和颜色笔刷）。此外，它还具备实时意图预测和参数调整能力，支持多模态大语言模型和扩散模型的协作，适用于个人娱乐、教育、专业设计及商业应用等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 714 浏览

SHMT

SHMT是一种基于自监督学习的高级化妆转移技术，由阿里巴巴达摩院与武汉理工大学联合研发。该技术无需成对训练数据，可将多种化妆风格自然迁移到目标面部图像上，通过“解耦-重建”策略和迭代双重对齐模块，实现高精度的纹理控制与对齐校正。适用于图像处理、虚拟试妆、影视设计等多个领域，具有高效、灵活、高质量的特点。

AI项目与工具 2025年06月12日 32 点赞 0 评论 713 浏览

MagicTailor

MagicTailor 是一款基于 DM-Deg 和 DS-Bal 技术的新型 AI 工具，支持组件可控的个性化图像生成。它能够动态干扰不需要的视觉语义，平衡概念与组件的学习，从而显著提升生成图像的质量和控制精度。MagicTailor 的核心功能包括组件可控个性化、动态掩码退化、双流平衡、解耦生成及多组件控制，适用于广告、游戏、电影制作等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 710 浏览

Mercury Coder

Mercury Coder 是 Inception Labs 推出的扩散型大语言模型，专为代码生成设计。它采用“从粗到细”机制，支持并行生成，每秒可处理超过 1000 个 token，效率显著高于传统模型。具备代码生成、补全、优化、多语言支持及可控生成等功能，适用于开发效率提升、教育辅助、代码优化及低代码平台集成等场景。

AI项目与工具 2025年06月12日 24 点赞 0 评论 710 浏览

AnchorCrafter

AnchorCrafter是一款基于扩散模型的智能视频生成工具，利用人-物交互（HOI）技术生成高质量主播风格产品推广视频。它支持物体外观保持、运动控制、遮挡处理及细节增强学习，适用于在线购物、社交媒体营销、电视广告制作等多个领域，显著提升视频真实感和互动性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 709 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期