扩散模型 - 智狐AI导航

Lemon Slice Live

Lemon Slice Live 是一款基于扩散变换器模型（DiT）的实时视频聊天工具，可将图片转化为可互动的动画角色，支持多语言和实时对话。通过优化模型提升流畅度与响应速度，适用于娱乐、教育、营销等多种场景，结合语音识别、文本生成等技术，提供完整的交互体验。

AI项目与工具 2025年06月11日 61 点赞 0 评论 641 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 641 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 639 浏览

LLaDA是一款基于扩散模型框架的新型大型语言模型，由中国人民大学高瓴AI学院与蚂蚁集团联合开发。它通过正向掩蔽和反向恢复机制建模文本分布，采用Transformer作为掩蔽预测器，优化似然下界提升生成效果。LLaDA在上下文学习、指令遵循和双向推理方面表现突出，尤其在反转推理任务中克服了传统自回归模型的局限。其8B参数版本在多项基准测试中表现优异，适用于多轮对话、文本生成、代码生成、数学推理和语

AI项目与工具 2025年06月12日 66 点赞 0 评论 639 浏览

VideoAnydoor

VideoAnydoor是一款由多所高校与研究机构联合开发的视频对象插入系统，基于文本到视频的扩散模型，支持高保真对象插入与精确运动控制。其核心模块包括ID提取器和像素变形器，能实现对象的自然融合与细节保留。该工具适用于影视特效、虚拟试穿、虚拟旅游、教育等多个领域，具备良好的通用性和扩展性。

AI项目与工具 2025年06月12日 61 点赞 0 评论 637 浏览

Imagen 4

Imagen 4是谷歌推出的最新图像生成AI模型，支持高达2K分辨率的图像生成，具备出色的细节呈现能力，可清晰展示复杂织物纹理、水滴折射及动物毛发质感。其文本渲染能力显著提升，适合广告、漫画等设计场景。支持多种艺术风格，包括超现实、抽象、插图和摄影，满足多样化创作需求。同时，Imagen 4拥有快速生成模式和高效的特征蒸馏技术，提升了生成速度，并已集成到Gemini应用、Google Worksp

AI项目与工具 2025年06月11日 76 点赞 0 评论 636 浏览

InstructMove

InstructMove是由东京大学与Adobe合作开发的图像编辑模型，基于视频帧对变化学习如何根据指令进行图像操作。它能够执行非刚性编辑、视角调整和元素重排等任务，同时支持精确的局部编辑。该模型采用真实视频数据训练，提升编辑自然性与真实性，适用于影视、广告、设计等多个领域。其技术基于多模态语言模型和扩散模型，结合掩码和ControlNet等控制机制，实现灵活高效的图像编辑。

AI项目与工具 2025年06月12日 21 点赞 0 评论 634 浏览

Seaweed APT

Seaweed APT是字节跳动研发的对抗性后训练模型，支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练，实现单步高质量输出，包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计，结合近似R1正则化技术，提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 631 浏览

VidSketch

VidSketch是由浙江大学研发的视频生成框架，支持通过手绘草图和文本提示生成高质量动画。它采用层级草图控制策略和时空注意力机制，提升视频连贯性和质量，适用于不同技能水平的用户。具备多样化风格支持和低门槛创作特点，广泛应用于创意设计、教学、广告及内容创作等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 630 浏览

RelightVid

RelightVid是一款基于时序一致性扩散模型的视频重照明工具，由多所高校和研究机构联合开发。它支持通过文本提示、背景视频或HDR环境贴图对视频进行细粒度和一致的场景编辑，具备全场景和前景保留重照明功能。该模型在预训练图像照明编辑框架基础上扩展，引入时序层提升视频重照明效果，并结合真实视频与3D渲染数据生成高质量数据对。RelightVid在保持时序一致性和照明细节方面表现突出，适用于影视制作、

AI项目与工具 2025年06月11日 53 点赞 0 评论 628 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期