AI音频 - 智狐AI导航

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 496 浏览

Audio

Audio-SDS是由NVIDIA研发的音频处理技术，基于文本提示引导音频生成，支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型，即可将预训练音频扩散模型扩展为多功能工具，具备高效推理能力，适用于游戏、音乐制作、教育及智能家居等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 582 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 703 浏览

SeeMuseums

SeeMuseums 是一款基于AI的智能导览工具，支持多语言、智能推荐和AI音频讲解，帮助用户个性化探索博物馆内容。用户可通过提问获取详细解读，记录笔记并保存收藏，适用于艺术学习、文化探索和教育辅助等多种场景，提升参观体验与知识获取效率。

AI项目与工具 2025年06月11日 71 点赞 0 评论 661 浏览

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型，基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列，通过掩码处理和去噪生成高质量音频，保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能，具有非自回归特性，提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

AI项目与工具 2025年06月11日 94 点赞 0 评论 752 浏览

Resona V2A

专注于将视频内容自动转化为高质量音频。Resona V2A通过分析视频中的视觉元素，Resona V2A 能够生成与视频内容相匹配的声音设计、音效和环境音。

Ai视频生成 2025年06月05日 11 点赞 0 评论 441 浏览

AI音频

首页

AI音频

列表

默认

浏览次数

发布日期

Aero

Audio

Stable Audio Open Small

SeeMuseums

PlayDiffusion

Resona V2A

AI音频 首页 AI音频

列表 默认 浏览次数 发布日期

Aero

Audio

Stable Audio Open Small

SeeMuseums

PlayDiffusion

Resona V2A

AI音频

首页

AI音频

列表

默认

浏览次数

发布日期