马萨诸塞大学阿默斯特分校 马萨诸塞大学,又译麻省大学(University of Massachusetts,简称UMASS),是美国公立大学系统。马萨诸塞大学起源于1863年建立在美国麻省安姆斯特镇(Amherst)的马萨诸塞大学阿默... 教育学习 1970年01月01日 0 点赞 0 评论 179 浏览
纸飞机AI 纸飞机AI是一款依托人工智能技术的虚拟陪伴应用,允许用户创建个性化AI智能体,提供情感支持、互动陪伴及社交体验。具备逼真的文本转语音功能,支持多角色选择和多样化的互动形式,包括朋友圈社交与角色对话创作。广泛应用于社交训练、情感支持、娱乐休闲及语言学习等领域。 AI项目与工具 2025年06月12日 89 点赞 0 评论 176 浏览
PDF to Podcast PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具,能够将 PDF 文档自动转换为高质量的音频内容,如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构,支持从 PDF 提取信息并生成结构化文本,再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点,并支持多种部署方式,适用于企业培训、技术简报、客户服务、医疗教育等多个领域。 AI项目与工具 2025年06月12日 32 点赞 0 评论 173 浏览
OuteTTS OuteTTS是一款基于开源技术的文本到语音(TTS)工具,利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音,具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容,适用于有声读物、智能客服、语音导航等多种应用场景。 AI项目与工具 2025年06月12日 36 点赞 0 评论 163 浏览
海豚配音TTS Online 海豚配音TTS Online是一个多功能的在线TTS服务平台,它通过先进的语音合成技术,为用户提供了一种便捷的方式来生成高质量的语音内容。 创作工具 1970年01月01日 0 点赞 0 评论 162 浏览
FishAudio 一个在线AI文本转语音合成配音声音克隆平台,以其自然、富有表现力的语音生成技术,为用户带来了前所未有的音频体验。 Ai语音工具 2025年06月05日 76 点赞 0 评论 147 浏览
Indic Parler Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型,支持 20 种印度语言和英语,提供 69 种独特语音。该模型基于深度学习架构,通过描述性文本输入实现对音调、语速、情感等参数的灵活控制,适用于多种语音合成场景。在低资源语言上表现优异,具备高自然度和清晰度的语音输出能力。 AI项目与工具 2025年06月12日 55 点赞 0 评论 141 浏览
Speech Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。 AI项目与工具 2025年06月11日 33 点赞 0 评论 140 浏览
Chatterbox Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容 AI项目与工具 2025年06月11日 55 点赞 0 评论 138 浏览