Llasa TTS

简介：Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI小编 717 阅读 0 评论 71 点赞

项目地址

Llasa TTS是由香港科技大学基于LLaMA架构开发的开源文本转语音（TTS）模型，具备高质量语音合成与音色克隆能力。该模型采用单层向量量化（VQ）编解码器和单一Transformer结构，与标准LLaMA模型保持一致，能够生成自然流畅、富有情感的语音输出。Llasa TTS支持多语言合成，并提供1B、3B和8B参数版本，适用于多种应用场景。其在训练和推理阶段均表现出色，通过扩展计算资源提升语音的自然度、韵律准确性和情感表达能力。此外，Llasa TTS支持零样本学习和长文本处理，用户仅需少量音频即可实现个性化语音克隆。

本文分类：AI项目与工具
本文标签：AI语音合成 LLaMA架构音色克隆多语言支持自然语音生成开源模型情感表达语音转换 TTS工具文本转语音
浏览次数：717 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/8768.html

评论列表共有 0 条评论

暂无评论

Llasa TTS

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复