Chatterbox Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容 AI项目与工具 2025年06月11日 55 点赞 0 评论 138 浏览
Fish Audio Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。 AI项目与工具 2025年06月11日 79 点赞 0 评论 113 浏览
OpenAudio S1 OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足 AI项目与工具 2025年06月11日 28 点赞 0 评论 275 浏览
Vocloner Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数 AI项目与工具 2025年06月11日 47 点赞 0 评论 316 浏览
海豚配音 一款集逼真效果、丰富音色和细腻情感于一体的全能AI配音平台。拥有超过500种栩栩如生的真人音色和1000多种独具特色的二次元音色。 字幕配音 2025年06月05日 35 点赞 0 评论 219 浏览
PPTalker 一款专门将PPT演示文稿转换成高质量视频的在线工具,通过多语言的AI语音解说和字幕,用户可以在几分钟内将PPT生成高质量的视频。 PPT资源 2025年06月05日 30 点赞 0 评论 121 浏览
易魔声EmotiVoice 易魔声EmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 Ai开源项目 2025年06月05日 27 点赞 0 评论 276 浏览
Streamer 销冠,卖货主播 LLM 大模型,Streamer-Sales就一款能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。 Ai开源项目 2025年06月05日 24 点赞 0 评论 227 浏览
DUIX 硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互。 Ai开源项目 2025年06月05日 84 点赞 0 评论 496 浏览
ElevenLabs ElevenLabs 是一个为内容创作者和出版商提供功能强大且用途广泛的 AI 语音软件的平台。它允许用户使用其先进的多用途 AI 语音工具以任何语音和风格生成高质量的口语音频。 Ai语音工具 2025年06月05日 12 点赞 0 评论 237 浏览