潜在扩散模型

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架，支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计，能够快速生成高质量图像并提升推理效率。

AI项目与工具 2025年06月12日 84 点赞 0 评论 686 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 641 浏览

VISION XL

VISION XL是一款基于潜在扩散模型的视频修复与超分辨率工具，支持视频去模糊、超分辨率提升、视频修复及帧平均等功能。它采用伪批一致性采样、批量一致性反演等技术，显著提高了处理效率和视频质量。VISION XL广泛应用于电影修复、监控视频增强、体育赛事直播等领域，能够满足高质量视频需求。

AI项目与工具 2025年06月12日 84 点赞 0 评论 528 浏览

Sketch2Sound

Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术，通过提取响度、亮度和音高概率等控制信号，结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架，同时赋予声音设计师更强的表达力与可控性，广泛适用于电影、游戏、音乐制作及教育等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 796 浏览

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架，基于音频条件的潜在扩散模型，无需中间3D或2D表示，可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法，提升视频时间一致性，并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 804 浏览

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具，能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导，确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域，显著提升了3D内容生成的效率和质量。

AI项目与工具 2025年06月12日 27 点赞 0 评论 590 浏览

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术，基于潜在扩散模型，能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入，具备良好泛化能力，采用高斯溅射技术实现高保真表示，并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 768 浏览

Sonauto AI

一款AI音乐生成器，允许用户通过将文本提示、歌词或旋律转换为完整的不同风格的歌曲。它采用了潜在扩散模型，这使得它与其他人工智能音乐生成模型相比更加可控。

Ai语音工具 2025年06月05日 94 点赞 0 评论 626 浏览

LayerDiffusion是一种创新的AI工具，利用大规模预训练的潜在扩散模型生成具有透明度的图像。该技术引入了“潜在透明度”的概念，将图像的alpha通道透明度信息编码到潜在空间中。LayerDiffusion不仅可以生成单个透明图像，还能生成多个透明图层，支持条件控制生成和图层内容结构控制，确保高质量的图像输出。此外，它还能够生成多个透明图层，并通过共享注意力机制和低秩适应确保图层间的和谐混

AI项目与工具 2024年01月01日 69 点赞 0 评论 417 浏览

Champ

Champ是由阿里巴巴、复旦大学和南京大学的研究人员共同开发的一款基于3D的AI工具，能够将人物图片转换为高质量的视频动画。Champ通过结合3D参数化模型和潜在扩散模型，精准捕捉和再现人体的3D形态和动态，保证动画的连贯性和视觉逼真度。此外，Champ还支持跨身份动画生成，并能与文本生成图像模型结合，使用户可以根据文本描述生成特定的角色外观和动作。

AI项目与工具 2024年01月01日 81 点赞 0 评论 712 浏览

潜在扩散模型

首页

潜在扩散模型

列表

默认

浏览次数

发布日期