语音 - 智狐AI导航

瓦兔漫剪工厂

一款帮助漫剪达人制作漫剪视频的辅助软件，其中集成文字转语音、频文字提取、漫画对白遮挡，自动搭配画面转场、音效、背景音乐等众多漫画剪辑功能，是一款漫剪小白也能一键使用的漫剪神器。

视频剪辑 2025年06月05日 92 点赞 0 评论 528 浏览

Voxify

Voxify是一款利用AI技术将文本转化为自然语音的专业工具，具备超过450种声音选择，支持140多种语言和方言。用户可自定义音调、语速及情感表达，满足多样化的应用场景。此外，Voxify支持多格式输出并提供API接口，便于集成至其他系统中。

AI项目与工具 2025年06月12日 82 点赞 0 评论 528 浏览

RecCloud

一个人工智能驱动的多媒体服务平台，RecCloud专门为视频和音频处理提供一套全面的工具。

视频剪辑 2025年06月05日 49 点赞 0 评论 529 浏览

MARS5

MARS5-TTS是一款开源的AI声音克隆工具，支持140多种语言的文本转语音功能。它能够生成高度逼真的语音，并处理复杂的韵律场景。该工具拥有12亿参数，基于超过15万小时的训练数据。用户可以通过文本中的标点符号和大小写等标记引导语音的韵律和情感，同时提供快速克隆和深度克隆两种模式。MARS5-TTS可应用于内容创作、语言学习、辅助技术、客户服务和多媒体娱乐等多种场景。

AI项目与工具 2025年06月12日 53 点赞 0 评论 529 浏览

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎，采用 BiCodec 技术实现音色与语义的精准控制，支持 3 秒语音克隆、多角色、多情绪表达及中英切换，语音自然流畅，接近广播级水平，适用于智能客服、有声书、影视配音等场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 530 浏览

3D

3D-Speaker是一个多模态开源项目，专注于通过结合声学、语义和视觉信息，实现高精度的说话人识别和语种识别。其主要功能包括说话人日志、说话人识别、语种识别、多模态识别以及重叠说话人检测。项目提供了工业级模型、训练与推理代码，以及多样化数据集，并支持复杂环境下的语音处理任务。应用场景涵盖会议记录、法庭记录、广播制作、电话客服和安全监控等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 531 浏览