AssemblyAI 一个提供将音频文件、视频文件和实时语音转录为文字的平台,提供了一个简单的API,允许用户访问用于转录和语音理解的即可用的AI模型。 Ai语音工具 2025年06月05日 57 点赞 0 评论 353 浏览
蘑兔听记 一款音视频转文字工具,超98%的语音识别准确率,30分钟音频只需3分钟就可转成文字,支持20多种方言、30余种外语,极大提高了工作和学习效率。 Ai语音工具 2025年06月05日 26 点赞 0 评论 353 浏览
Hertz Hertz-Dev是一款由Standard Intelligence开发的开源音频模型,专注于低延迟实时对话AI。它具备强大的音频生成与处理能力,能够处理和生成高质量的音频信号,并支持多任务微调,适用于语音识别、语音合成等多种应用场景。此外,Hertz-Dev还提供了音频自动编码、流式生成等功能,广泛应用于智能助手、客户服务、语音识别及合成等领域。 AI项目与工具 2025年06月12日 48 点赞 0 评论 351 浏览
VoicePanel 一个利用AI进行语音或视频采访的平台,Voicepanel 的 AI 可以招募您的目标受众,通过语音或视频进行采访,并立即合成可操作的见解总结。 Ai语音工具 2025年06月05日 47 点赞 0 评论 351 浏览
音刻 Inkr 是一款高效的 AI 语音转录工具,支持超过 100 种语言,具备快速转录、多语言支持、说话人识别、高准确率等功能。其“FLASH”模式可在几秒内完成转录,适用于会议记录、采访整理、字幕制作及学习辅助等多种场景,提升信息处理效率。 AI项目与工具 2025年06月11日 47 点赞 0 评论 351 浏览
Indic Parler Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型,支持 20 种印度语言和英语,提供 69 种独特语音。该模型基于深度学习架构,通过描述性文本输入实现对音调、语速、情感等参数的灵活控制,适用于多种语音合成场景。在低资源语言上表现优异,具备高自然度和清晰度的语音输出能力。 AI项目与工具 2025年06月12日 55 点赞 0 评论 346 浏览
海豚配音TTS Online 海豚配音TTS Online是一个多功能的在线TTS服务平台,它通过先进的语音合成技术,为用户提供了一种便捷的方式来生成高质量的语音内容。 创作工具 1970年01月01日 0 点赞 0 评论 344 浏览
声动视界 SoundView是一款面向带货短视频的AI工具,提供视频翻译、文本转语音及视频配音等服务,支持100多种语言,能有效提升视频完播率和客户咨询率,同时具备音色模仿功能,助力用户优化素材复用。主要应用于跨境电商、社交媒体营销、教育培训、企业宣传及旅游业等领域。 AI项目与工具 2025年06月12日 53 点赞 0 评论 344 浏览