语音合成 - 智狐AI导航

Narakeet

Narakeet 是一款基于自然语音合成技术的在线工具，支持将文本、文档和字幕转换为高质量音频并同步至视频。提供 100 多种语言和 800 多种声音，支持自动化视频制作和多平台分发，适用于教育培训、市场营销、企业沟通及个人创作等多种用途。

AI项目与工具 2025年06月12日 85 点赞 0 评论 753 浏览

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型，基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列，通过掩码处理和去噪生成高质量音频，保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能，具有非自回归特性，提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

AI项目与工具 2025年06月11日 94 点赞 0 评论 752 浏览

cnChar

一个功能全面、多端支持的汉字拼音笔画JavaScript库，用于处理汉字相关的多种功能，包括拼音、笔画、简繁体转换等。

字体字库 2025年06月05日 95 点赞 0 评论 746 浏览

MaskGCT

MaskGCT是一款基于掩码生成模型与语音表征解耦编码技术的语音合成大模型，由趣丸科技与香港中文大学（深圳）联合开发。其主要功能包括声音克隆、跨语种语音合成、语音控制及高质量语音数据集支持。该模型在多个TTS基准数据集上表现优异，可快速精准地克隆音色并灵活调整语音属性，适用于多种语言，已开源并面向全球用户开放。

AI项目与工具 2025年06月12日 35 点赞 0 评论 743 浏览

Sonic

Sonic是由腾讯与浙江大学联合开发的音频驱动肖像动画框架，基于音频信号生成逼真面部表情和动作。它通过上下文增强音频学习和运动解耦控制器，提升唇部同步精度与运动多样性。Sonic在长视频生成中表现出色，具备高稳定性与自然连贯性，支持用户自定义参数。适用于虚拟现实、影视制作、在线教育、游戏开发和社交媒体等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 741 浏览

星声AI

星声AI是一款智能化播客生成工具，支持文字、网页链接或文档输入，自动生成结构完整的播客脚本，并通过高质量语音合成技术转化为自然流畅的音频内容。平台支持中、英、日、韩四国语言，提供多种音色与风格选择，具备音频编辑、内容拆解、多平台发布等功能，适用于知识分享、企业培训、内容创作等多种场景。

AI项目与工具 2025年06月12日 21 点赞 0 评论 741 浏览

CopyCopter

CopyCopter是一款基于AI技术的短视频生成工具，能够高效地将长篇文本转化为高质量的短视频内容。它具备自动脚本生成、多语言语音选择、图片生成、库存视频素材调用等功能，并支持视频编辑、社交媒体发布及品牌定制化服务，广泛应用于内容营销、社交媒体管理、教育及新闻媒体等领域，助力用户提升创作效率和作品吸引力。

AI项目与工具 2025年06月12日 29 点赞 0 评论 732 浏览

Actor Mode

Actor Mode 是由 ElevenLabs 开发的 AI 语音生成工具，支持用户通过自身声音生成风格一致的语音内容。它具备多语言支持、语音属性调节、即时生成等功能，适用于有声读物、视频配音、虚拟助手等多个领域。用户可通过录制或上传音频，让 AI 提取语音特征并生成符合要求的语音输出，提高创作效率与个性化表达。

AI项目与工具 2025年06月12日 87 点赞 0 评论 730 浏览

牛学长变声精灵

牛学长变声精灵作为一款AI实时变声器，有着数百种变声特效，一键美化音色可适配各类游戏和直播软件。

创作工具 1970年01月01日 0 点赞 0 评论 726 浏览

Toucan TTS

Toucan TTS是一款由德国斯图加特大学自然语言处理研究所开发的文本到语音合成工具箱。它基于Python和PyTorch构建，支持超过7000种语言及多种方言和变体。主要功能包括多说话人语音合成、语音风格克隆、人机交互编辑、语音参数调整以及发音清晰度和性别特征调整。该工具箱适用于语音模型教学、文字朗读和多语言应用开发等场景，并提供在线交互式演示功能，方便用户快速理解和使用。

AI项目与工具 2025年06月12日 89 点赞 0 评论 720 浏览

语音合成

首页

语音合成

列表

默认

浏览次数

发布日期