ebook2audiobookXTTS ebook2audiobookXTTS是一款开源AI工具,可将EPUB、PDF、MOBI等多种电子书格式转换为高质量的有声书(.m4b)。通过集成Calibre和Coqui XTTS技术,支持多语言处理和章节识别,同时保留电子书元数据,适用于个人学习、教育培训、企业培训以及公共图书馆等场景,帮助用户高效获取知识。 AI项目与工具 2025年06月12日 78 点赞 0 评论 494 浏览
VITA VITA-Audio 是一款开源的端到端多模态语音大模型,具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略,使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景,适用于各类语音交互系统。 AI项目与工具 2025年06月11日 19 点赞 0 评论 497 浏览
NotebookLlama NotebookLlama是一款基于Meta开发的开源工具,能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤,无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南,并支持多种应用场景,包括教育、新闻、企业培训和有声书制作等。 AI项目与工具 2025年06月12日 29 点赞 0 评论 498 浏览
FakeYou | 语音克隆和仿声 FakeYou 是一款功能强大的文本到语音工具,可以帮助用户生成个性化的语音内容,同时支持实时语音克隆和仿声模拟体验。 Ai语音工具 2025年06月05日 84 点赞 0 评论 506 浏览
Kokoro Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具,基于StyleTTS 2与ISTFTNet架构,支持多种语音风格和自然语调,具备实时处理能力。支持美式与英式英语,提供10种语音包,适用于教育、游戏、客服等多种场景。支持本地部署与API集成,确保数据安全与高效运行。 AI项目与工具 2025年06月12日 33 点赞 0 评论 509 浏览
Clipchamp Clipchamp,可帮助你创作内容的智能工具,有自动生成字幕、文本转语音、调整视频大小等功能,现在是Microsoft旗下公司。 视频剪辑 2025年06月05日 83 点赞 0 评论 516 浏览