Kokoro

简介：Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI小编 946 阅读 0 评论 33 点赞

官网地址

Kokoro-TTS是由hexgrad开发的一款轻量级文本转语音（TTS）模型，拥有8200万参数。该模型基于StyleTTS 2与ISTFTNet的混合架构，采用纯解码器设计，不依赖扩散模型，从而降低了计算复杂度，提升了语音合成效率和实时处理能力。其支持多种语音风格，包括耳语等特殊形式，能够生成自然流畅的语调和韵律，适用于不同场景下的语音表达需求。训练数据涵盖多种授权音频及IPA音素标签，确保了内容的合规性与多样性。目前，Kokoro-TTS支持美国英语和英国英语，并提供10种不同的语音包，覆盖不同性别和语音特征。此外，它具备本地处理能力，无需上传数据至云端，保障了用户的数据安全。开发者可通过API轻松集成到各类应用中，满足从桌面到移动端的多样化需求。

本文分类：AI项目与工具
本文标签：AI语音合成文本转语音 TTS模型语音风格实时处理本地部署音频生成多语言支持开发者工具自然语调
浏览次数：946 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/9417.html

评论列表共有 0 条评论

暂无评论

Kokoro

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复