扩散模型 - 智狐AI导航

EasyControl

EasyControl是基于扩散变换器（DiT）架构的高效控制框架，采用轻量级LoRA模块实现多条件控制，支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制，优化计算效率，提升生成质量与灵活性，适用于多种图像处理场景。

AI项目与工具 2025年06月12日 48 点赞 0 评论 773 浏览

InvSR

InvSR是一款基于扩散模型逆过程开发的图像超分辨率工具，通过深度噪声预测器和灵活采样机制，从低分辨率图像恢复高质量高分辨率图像。它支持多种应用场景，包括文化遗产保护、视频监控、医疗成像及卫星影像分析，同时兼顾计算效率与性能表现。

AI项目与工具 2025年06月12日 14 点赞 0 评论 773 浏览

Animate Anyone 2

Animate Anyone 2 是由阿里巴巴通义实验室开发的高保真角色动画生成技术，能基于输入图像和运动信号生成高质量、自然流畅的角色动画。通过环境感知、形状无关掩码策略、物体交互增强等技术，实现角色与环境的深度融合，提升动画的真实感与稳定性。支持复杂动作处理、多角色互动及跨身份动画生成，适用于影视、广告、VR/AR、游戏及教育等多个领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 771 浏览

DiffuEraser

DiffuEraser是一款基于稳定扩散模型的视频修复工具，具备未知像素生成、已知像素传播、时间一致性维护等功能。通过集成运动模块和优化网络架构，它能有效提升视频修复质量，减少噪声和幻觉。适用于影视后期制作、老电影修复、监控视频增强等多个领域，支持高精度和高连贯性的视频内容修复与增强。

AI项目与工具 2025年06月12日 98 点赞 0 评论 768 浏览

Concept Lancet

Concept Lancet（CoLan）是一种基于潜在空间稀疏分解的图像编辑框架，能够实现零样本、即插即用的精确概念替换、添加与移除。它通过构建视觉概念字典，结合扩散模型生成高质量图像，保持视觉一致性。适用于创意设计、影视制作、游戏开发等多个领域，提供高效的图像编辑解决方案。

AI项目与工具 2025年06月11日 28 点赞 0 评论 768 浏览

Shining Yourself

Shining Yourself是商汤科技推出的高保真饰品虚拟试戴技术，基于扩散模型实现逼真试戴效果。支持多饰品、个性化调整、多场景模拟及动态展示，适用于电商、设计、社交及品牌推广等场景，提升用户体验与决策效率。

AI项目与工具 2025年06月12日 58 点赞 0 评论 768 浏览

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型，具备17亿参数，支持多种图像风格生成，包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色，适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构（MoE），并集成多种文本编码器，实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源，便于研究与应用。

AI项目与工具 2025年06月12日 64 点赞 0 评论 766 浏览

LightLab

LightLab是一款基于扩散模型的图像光源控制工具，支持对图像中的光源强度、颜色、环境光以及虚拟光源进行精细调整。通过结合真实照片与合成图像训练，该工具能生成逼真的光照效果，如阴影和反射。其交互式界面使用户能够直观地进行光照编辑，适用于摄影后期、影视特效、室内设计、游戏开发和广告制作等多个领域。

AI项目与工具 2025年06月11日 34 点赞 0 评论 763 浏览

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术，基于潜在扩散模型，能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入，具备良好泛化能力，采用高斯溅射技术实现高保真表示，并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 762 浏览

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架，通过“3D Bundle Image”结构实现多视角图像与法线图的融合，从而高效生成和编辑3D模型。它支持文本与图像输入，具备3D编辑、网格优化和纹理增强等功能，适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 760 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期