AI音频 - 智狐AI导航

万兴喵影（Filmora）

万兴喵影（Filmora），曾用名喵影工厂、万兴神剪手，是万兴科技集团股份有限公司深圳分公司旗下的一款视频制作软件。自2015年4月上线以来，万兴喵影迅速获得了超过1亿用户的认可和...

Ai视频生成 1970年01月01日 0 点赞 0 评论 300 浏览

Replay

Replay是一款基于AI技术的音频处理工具，可精准分离音乐中的主唱、人声和伴奏等音轨。支持多种音频格式，具备高质量输出、实时预览、参数调整和自动化处理等功能，适用于音乐制作、KTV伴奏、教学及内容创作等领域。操作简便，兼容多平台，为音乐创作和分析提供高效解决方案。

AI项目与工具 2025年03月22日 72 点赞 0 评论 607 浏览

Resona V2A

专注于将视频内容自动转化为高质量音频。Resona V2A通过分析视频中的视觉元素，Resona V2A 能够生成与视频内容相匹配的声音设计、音效和环境音。

Ai视频生成 2025年06月05日 11 点赞 0 评论 441 浏览

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型，基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列，通过掩码处理和去噪生成高质量音频，保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能，具有非自回归特性，提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

AI项目与工具 2025年06月11日 94 点赞 0 评论 752 浏览

SeeMuseums

SeeMuseums 是一款基于AI的智能导览工具，支持多语言、智能推荐和AI音频讲解，帮助用户个性化探索博物馆内容。用户可通过提问获取详细解读，记录笔记并保存收藏，适用于艺术学习、文化探索和教育辅助等多种场景，提升参观体验与知识获取效率。

AI项目与工具 2025年06月11日 71 点赞 0 评论 661 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 704 浏览

Audio

Audio-SDS是由NVIDIA研发的音频处理技术，基于文本提示引导音频生成，支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型，即可将预训练音频扩散模型扩展为多功能工具，具备高效推理能力，适用于游戏、音乐制作、教育及智能家居等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 582 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 496 浏览

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具，支持将音频中不同说话人的语音精准分离至独立轨道，适用于广播级音频处理。它具备高保真音频处理能力，支持高采样率，能处理长达数小时的录音，在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域，提升音频编辑效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 778 浏览

AudioX

AudioX 是一种基于多模态输入的音频生成模型，支持文本、视频、图像等多种输入方式，能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略，提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力，适用于视频配乐、动画音效、音乐创作等多个场景。

AI项目与工具 2025年06月12日 68 点赞 0 评论 456 浏览

AI音频

首页

AI音频

列表

默认

浏览次数

发布日期