音频 - 智狐AI导航

Muyan-TTS是一款面向播客场景的开源文本转语音工具，基于超10万小时播客数据训练，支持零样本语音合成与说话人适配，可在0.33秒内生成1秒音频，适合实时与长内容合成。支持本地部署与API调用，应用于播客、有声书、视频配音、AI角色及新闻播报等领域，兼具高效性与灵活性。

AI项目与工具 2025年06月11日 94 点赞 0 评论 455 浏览

AudioX 是一种基于多模态输入的音频生成模型，支持文本、视频、图像等多种输入方式，能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略，提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力，适用于视频配乐、动画音效、音乐创作等多个场景。

AI项目与工具 2025年06月12日 68 点赞 0 评论 454 浏览

酷音网是一个真人配音与AI配音、视频拍摄与制作、音乐作词与谱曲、视频策划与创意等领域的创作、交易、推广运营于一体的音视频交易服务平台，致力于打造专注音视频领域的商业生态圈。

创作工具 1970年01月01日 0 点赞 0 评论 454 浏览

ReadSpeaker 提供了一系列强大的文本转语音解决方案，可在任何环境中即时部署逼真、定制的语音交互。

创作工具 1970年01月01日 0 点赞 0 评论 454 浏览

Musico 是一个人工智能驱动的软件引擎，可以生成音乐。它可以对手势、动作、代码或其他声音做出反应。

创作工具 1970年01月01日 0 点赞 0 评论 452 浏览

EDTalk是一款基于音频驱动的唇部同步模型，支持嘴型、头部姿态及情感表情的独立操控。用户可通过上传图片、音频和参考视频生成具有唇形同步和情感表达的动态人脸视频，广泛应用于教育、影视后期、虚拟现实等领域。其高效解耦机制和轻量化设计使其易于操作且资源友好。

AI项目与工具 2025年06月12日 93 点赞 0 评论 452 浏览

Audo AI为创作者和开发人员提供噪声消除产品，包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展，自动去除背景噪音，增强音频录制，...

创作工具 1970年01月01日 0 点赞 0 评论 451 浏览

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发...

Ai语音工具 1970年01月01日 0 点赞 0 评论 449 浏览

Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具，支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能，支持多种格式导出，并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。

AI项目与工具 2025年06月12日 10 点赞 0 评论 445 浏览

Singify 作为一个 AI 驱动的歌曲翻唱生成器，为用户提供了一个创新的方式来重新演绎和享受音乐。

创作工具 1970年01月01日 0 点赞 0 评论 445 浏览

音频

首页

音频