音效 - 智狐AI导航

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具，具备文本到视频生成、图像到视频转换等功能，支持高清视频输出及音效匹配。它通过三维变分自编码器（3D VAE）、Transformer架构等技术手段，提升了视频生成的质量与效率，适用于内容创作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 947 浏览

Sketch2Sound

Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术，通过提取响度、亮度和音高概率等控制信号，结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架，同时赋予声音设计师更强的表达力与可控性，广泛适用于电影、游戏、音乐制作及教育等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 916 浏览

MusicFX DJ

MusicFX DJ是一款由Google DeepMind开发的人工智能音乐生成工具，利用实时文本提示生成多样化音乐作品。它支持多提示词混合、风格精细调控、乐器编排以及高质量音频输出等功能，适用于个人创作、现场表演、音乐教育及社交媒体内容制作等多个场景，为音乐爱好者和专业人士提供便捷高效的创意工具。

AI项目与工具 2025年06月12日 30 点赞 0 评论 875 浏览

可灵2.0

可灵2.0是快手推出的AI视频生成模型，支持文生视频和图生视频，具备复杂动态生成、动作流畅性和多模态编辑能力。它能根据用户输入的文字或图片生成高质量视频，提升视频的真实感和沉浸感，适用于影视、广告、教育、游戏等领域，提高创作效率与灵活性。

AI项目与工具 2025年06月11日 70 点赞 0 评论 875 浏览

Fineshare VoiceTrans

Fineshare VoiceTrans 是一款支持实时变声的 AI 工具，可将声音转换为多种角色或性别，保留原有情感与语调。提供丰富的音效库、声音实验室和预设声音包，适用于游戏、直播、配音等场景。用户可通过不同订阅计划获得无限使用权限和定制服务，提升创作与互动体验。

AI项目与工具 2025年06月12日 24 点赞 0 评论 871 浏览

FUZZ

由Riffusion推出的一款基于扩散模型（Diffusion Model）的全新音乐生成模型，该工具能够通过“想象”生成音频的声谱图（Spectrogram），然后将其转换为音频。

Ai语音工具 2025年06月05日 33 点赞 0 评论 869 浏览

MultiFoley

MultiFoley是一款基于多模态控制的音效生成系统，能够根据文本、音频或视频输入生成与视频同步的高质量Foley声音效果。它支持文本驱动和音频驱动的音效生成，同时具备音频扩展和质量控制功能，广泛应用于电影、游戏、动画及虚拟现实等领域，为用户提供灵活且高效的声音设计解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 848 浏览

Veo 3

Veo 3是谷歌推出的新一代视频生成模型，在I/O开发者大会上发布。它是首个能生成视频背景音效的模型，可合成画面并匹配人物对话和口型，支持1080P高质量视频生成，具备物理模拟与口型同步能力，可生成超过60秒的视频片段，并支持多种视觉风格。Veo 3整合了多项先进技术，适用于影视制作、广告营销及教育领域。

AI项目与工具 2025年06月11日 90 点赞 0 评论 837 浏览

PixVerse V4

PixVerse V4 是一款基于 AI 的视频生成工具，支持通过文本或图片快速生成高质量视频，最快仅需 5 秒。具备音效生成、人声配音、视频风格转换等功能，适用于多种创作场景。其在语义理解、物理表现和特效处理方面有显著提升，适合个人创作、广告营销、教育及影视娱乐等领域使用。

AI项目与工具 2025年06月12日 97 点赞 0 评论 783 浏览

SeedFoley

SeedFoley 是由字节跳动开发的端到端视频音效生成模型，能智能识别并生成与视频内容高度同步的动作和环境音效。通过融合视频时空特征与扩散生成技术，提升音效的准确性和细腻度，支持多种视频长度，适用于生活Vlog、短片制作、游戏视频等多种场景，显著提升视频的沉浸感和表现力。

AI项目与工具 2025年06月12日 63 点赞 0 评论 775 浏览

音效

首页

音效

列表

默认

浏览次数

发布日期