AI语音 - 智狐AI导航

ReadSpeaker

ReadSpeaker 提供了一系列强大的文本转语音解决方案，可在任何环境中即时部署逼真、定制的语音交互。

创作工具 1970年01月01日 0 点赞 0 评论 456 浏览

Chinese

Chinese-LiPS是由智源研究院与南开大学联合开发的高质量中文多模态语音识别数据集，包含100小时语音、视频及手动转录文本。其创新性融合唇读视频与幻灯片内容，显著提升语音识别性能，实验表明可降低字符错误率约35%。适用于教学、科普、虚拟讲解等复杂语境，为多模态语音识别研究提供丰富数据支持。

AI项目与工具 2025年06月11日 47 点赞 0 评论 456 浏览

Audo Studio

Audo AI为创作者和开发人员提供噪声消除产品，包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展，自动去除背景噪音，增强音频录制，...

创作工具 1970年01月01日 0 点赞 0 评论 452 浏览

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发...

Ai语音工具 1970年01月01日 0 点赞 0 评论 450 浏览

音刻

Inkr 是一款高效的 AI 语音转录工具，支持超过 100 种语言，具备快速转录、多语言支持、说话人识别、高准确率等功能。其“FLASH”模式可在几秒内完成转录，适用于会议记录、采访整理、字幕制作及学习辅助等多种场景，提升信息处理效率。

AI项目与工具 2025年06月11日 47 点赞 0 评论 443 浏览

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型，支持 20 种印度语言和英语，提供 69 种独特语音。该模型基于深度学习架构，通过描述性文本输入实现对音调、语速、情感等参数的灵活控制，适用于多种语音合成场景。在低资源语言上表现优异，具备高自然度和清晰度的语音输出能力。

AI项目与工具 2025年06月12日 55 点赞 0 评论 440 浏览