扩散模型 - 智狐AI导航

Boximator是一种视频合成技术，通过引入硬框和软框实现对视频中对象的位置、形状或运动路径的精细控制。它基于视频扩散模型，通过多阶段训练和自跟踪技术，确保视频合成过程中的高质量和逼真度。应用场景包括电影和电视制作、游戏开发以及VR和AR内容创作。

AI项目与工具 2024年02月20日 89 点赞 0 评论 572 浏览

JoyCaption是一款开源图像提示词生成工具，支持多种图像风格和内容类型，具备丰富的生成模式和灵活的提示控制功能。它适用于社交媒体、图像标注、内容创作、视觉辅助及教育等多个场景，能够生成高质量的描述性字幕和提示词，提升图像处理和创作效率。该工具性能优越，且完全免费开放。

AI项目与工具 2025年01月16日 91 点赞 0 评论 499 浏览

PixWeaver是一个基于人工智能的图像创作平台。它能帮助用户无需学习复杂的设计软件,通过语音或文字描述就可以生成理想中的图像。

Ai绘画生成 2025年06月05日 47 点赞 0 评论 689 浏览

Meta开发的文本到视频生成模型，Emu Video使用扩散模型根据文本提示创建视频，首先生成图像，然后根据文本和生成的图像创建视频。

Ai视频生成 2025年06月05日 40 点赞 0 评论 515 浏览

北京极佳视界科技有限公司联合清华大学自动化系共同发布的Sora级视频生成大模型。

Ai视频生成 2025年06月05日 64 点赞 0 评论 493 浏览

由Riffusion推出的一款基于扩散模型（Diffusion Model）的全新音乐生成模型，该工具能够通过“想象”生成音频的声谱图（Spectrogram），然后将其转换为音频。

Ai语音工具 2025年06月05日 33 点赞 0 评论 784 浏览

一款AI音乐生成器，允许用户通过将文本提示、歌词或旋律转换为完整的不同风格的歌曲。它采用了潜在扩散模型，这使得它与其他人工智能音乐生成模型相比更加可控。

Ai语音工具 2025年06月05日 94 点赞 0 评论 622 浏览

字节跳动研发的一种视频生成模型，PixelDance通过结合文本指导和首尾帧图片指导的方式，能够生成具有复杂场景与动作的视频。

Ai平台模型 2025年06月05日 44 点赞 0 评论 1288 浏览

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调，即可实现一致的视频编辑效果。

Ai开源项目 2025年06月05日 25 点赞 0 评论 435 浏览

百度公司推出的视频生成模型，能够以文本和图像的任意组合作为输入条件进行视频生成。

Ai开源项目 2025年06月05日 22 点赞 0 评论 644 浏览

扩散模型

首页

扩散模型