克隆

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容

Tavus.io

Tavus 是一个可让您使用人工智能为观众创建个性化视频的平台。您可以录制一个视频,Tavus 将为每个观看者生成数千或数百个具有不同语音和视觉的变体视频。

RuoYi AI

RuoYi AI 是一个集成了本地 RAG 方案和多模型支持的全栈式 AI 开发平台,提供高效的代码管理、数据隐私保护和丰富的多媒体功能。支持多种大语言模型接入,具备微信扩展、插件系统和支付接口,适用于企业及个人开发者构建智能应用。

HeyGen

HeyGen是一款AI数字人视频创作平台,具备即时数字人视频制作、多语言翻译配音、语音克隆、文本转语音等功能。它提供了丰富的视频模板库和强大的素材库,支持用户轻松创建高质量的数字人视频。HeyGen适用于多种场景,包括讲解说明、市场营销和企业培训,助力用户提高工作效率和视频质量。

Medio.cool

Medio.cool是一款面向企业海外市场的AI视频编辑工具,提供视频水印去除、商品翻译、商品解说视频自动生成等功能。它支持多语言翻译,涵盖超过100种国际语言,并能一键下载4K高清原视频,适用于YouTube、TikTok等多个平台,助力企业高效实现全球化推广。

给麦

给麦是一款集成了AI技术的音乐创作平台,主要面向音乐创作者、歌手及普通用户。它提供音色克隆、快速歌曲合成、AI翻唱、AI写歌等功能,同时拥有线上K歌、虚拟人声、语聊派对和破冰游戏等社交娱乐功能,旨在帮助用户轻松创作音乐并享受互动体验。

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统,专注于中文语音合成,支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法,结合汉字与拼音,提升发音准确性。系统具备零样本语音克隆能力,音质优秀,广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富,性能指标优异,包括低字词错误率、高扬声器相似性和高主观音质评分。

Fish Audio

Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。

Tavus – AI视频生成平台,支持数字人克隆和实时对话

Tavus 是一个先进的 AI 视频生成平台,提供逼真的数字人克隆和实时对话式视频。基于 Phoenix-2 模型和对话式视频接口(CVI),Tavus 支持企业快速部署 AI 视频产品,提升用户体验并确保安全合规。主要功能包括 AI 视频生成、实时对话、开发者文档和工具,适用于客户服务、个性化营销、虚拟助手、教育和产品演示等多种应用场景。

Audie.AI

一款人工智能驱动的有声读物制作工具,可让您轻松地将书籍转换为有声读物。借助 Audie.ai,您可以自动从各种声音中进行选择来叙述您的有声读物,并在做出决定之前听取每个声音的样本。