声音克隆

Heygem

Heygem是一款由硅基智能推出的开源数字人模型,支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音,30秒内完成克隆,60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势,适用于内容创作、教育、直播、影视及客服等多个领域,提供高效、低成本的数字人解决方案。

创视元数字人

创视元通过其简单易用的界面和先进的AI技术,使得数字人视频创作变得快速、便捷。无论是企业宣传、教育培训还是其他应用场景,创视元都能提供高效的解决方案。

VoiceCanvas

VoiceCanvas 是一款开源的多语言语音合成平台,基于 AI 技术提供高质量文字转语音服务,支持超过 50 种语言。用户可通过上传简短音频实现个性化声音克隆,并集成多种语音服务以保障输出质量。平台适用于内容创作、教育、企业及个人等多种场景,提升语音内容制作效率。

海豚AI配音

海豚AI配音是一款支持多语言、多音色的文本转语音工具,提供超过500种真人音色和1000多种二次元音色,适用于有声书、自媒体、教育、动漫及广告等领域。支持多人配音、声音克隆、变声等功能,操作简便,适合各类内容创作者提升作品质量。

码多多AI数字人源码系统

一站式AI数字人视频制作源码系统,支持真人声音克隆和真人形象克隆,只需随意上传一段真人视频,即可快速完成声音以及形象克隆。

MiniMax MCP Server

MiniMax MCP Server 是一款基于 MCP 协议的多模态生成服务器,支持视频、图像、语音及声音克隆等功能。其具备高分辨率输出、自然语音生成与声音克隆能力,兼容多种主流客户端。平台采用客户端-服务器架构,结合 RAG 技术提升响应准确性,适用于教学、游戏开发、内容创作等多个领域。

1号AI

1号AI是一款由风平智能开发的AI数字分身视频交互平台,提供包括形象克隆、声音克隆、智能对话等功能。用户可以轻松创建个性化数字分身,通过简单的文本或语音输入快速制作高质量视频,广泛应用于电商直播、教育培训、客户服务等领域。它提高了内容生产效率,降低了创作门槛,为用户提供创新的交互体验。

MaskGCT

MaskGCT是一款基于掩码生成模型与语音表征解耦编码技术的语音合成大模型,由趣丸科技与香港中文大学(深圳)联合开发。其主要功能包括声音克隆、跨语种语音合成、语音控制及高质量语音数据集支持。该模型在多个TTS基准数据集上表现优异,可快速精准地克隆音色并灵活调整语音属性,适用于多种语言,已开源并面向全球用户开放。

Fineshare FineVoice

Fineshare FineVoice 是一款多功能 AI 配音生成工具,支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项,适用于视频制作、播客、教育、营销等多种场景,助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作,适合个人与企业用户使用。

YouDub

一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。