TTS - 智狐AI导航

Open NotebookLM

Open NotebookLM是一个开源工具，能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型，生成自然流畅的对话式音频，并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件，适用于教育、科研、商业分析等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 947 浏览

VideoChat

VideoChat是一款开源的实时数字人对话系统，支持语音输入与实时对话功能。用户可自定义数字人形象与音色，实现音色克隆。系统集成多种技术，包括语音识别、大语言模型生成及文本转语音，支持流式视频输出，适用于客户服务、在线教育、新闻播报、直播互动及娱乐等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 973 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 1013 浏览

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具，能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤，无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南，并支持多种应用场景，包括教育、新闻、企业培训和有声书制作等。

AI项目与工具 2025年06月12日 29 点赞 0 评论 1028 浏览

Parler

Parler-TTS是一款由Hugging Face开发的开源文本到语音（TTS）模型，能够模仿特定说话者的风格，生成高质量、自然的语音。该模型采用轻量级设计，包括文本编码器、解码器和音频编解码器，通过整合文本描述和嵌入层，优化了语音生成过程。Parler-TTS的所有资源公开，促进了高质量、可控TTS模型的发展。此外，用户还可以根据需要对模型进行自定义训练和微调。

AI项目与工具 2024年01月01日 91 点赞 0 评论 1177 浏览

TTS

首页

TTS

列表

默认

浏览次数

发布日期

Open NotebookLM

VideoChat

Kokoro

NotebookLlama

Parler

TTS 首页 TTS

列表 默认 浏览次数 发布日期

Open NotebookLM

VideoChat

Kokoro

NotebookLlama

Parler

TTS

首页

TTS

列表

默认

浏览次数

发布日期