文本转语音

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型，包含文本转语音（Takin TTS）、音色转换（Takin VC）及声音风格变换（Takin Morphing）。它采用最新大型语言模型技术，可生成接近真人的高质量语音，并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域，具有音色精准、风格多样等特点。

AI项目与工具 2025年06月12日 63 点赞 0 评论 596 浏览

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型，利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务，如音乐创作、声音效果设计及语音合成，并可通过ComposableART技术实现对声音属性的精细调控。此外，Fugatto擅长生成动态变化的声音景观，广泛应用于音乐创作、声音设计及广告音频制作等领域。

AI项目与工具 2025年06月12日 44 点赞 0 评论 535 浏览

audiobot

audiobot是一款利用AI技术实现文本到语音转换的服务平台，支持多语言及多样化的声音选项。其主要功能包括文本转语音处理、多语言兼容性、即时音频生成及高质量MP3下载等。广泛应用于视频制作、有声读物创作、商业宣传及教育培训等领域，满足用户对专业音频内容的需求。

AI项目与工具 2025年06月12日 86 点赞 0 评论 669 浏览

声动视界

SoundView是一款面向带货短视频的AI工具，提供视频翻译、文本转语音及视频配音等服务，支持100多种语言，能有效提升视频完播率和客户咨询率，同时具备音色模仿功能，助力用户优化素材复用。主要应用于跨境电商、社交媒体营销、教育培训、企业宣传及旅游业等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 495 浏览

Amphion

Amphion是一款开源音频生成工具包，包含文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）和文本转音乐（TTM）等功能。它支持多种神经声码器，并提供可视化模型架构，帮助用户快速掌握音频生成技术。通过统一框架和预训练模型，Amphion推动了音频生成领域的研究和应用发展。

AI项目与工具 2025年06月12日 63 点赞 0 评论 774 浏览

芊芊妙音

芊芊妙音是一款基于AI技术的配音与变声工具，拥有丰富的音色库及强大的音频处理能力。它支持文字提取、语音转文字、音频编辑等功能，可广泛应用于社交媒体内容创作、视频制作、语言学习等领域。用户可以通过该软件实现个性化声音定制，并轻松分享作品至各大社交平台。

AI项目与工具 2025年06月12日 11 点赞 0 评论 752 浏览

猫头音

猫头音是一款基于深度学习技术的AI配音与翻唱工具，支持将文字转化为高质量语音输出，并提供多样化音色选择及丰富的音频处理功能。用户可通过简单操作实现个性化配音、修音翻唱以及音频编辑，广泛适用于视频创作、广告制作、有声读物开发及音乐翻唱等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 562 浏览

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具，能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤，无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南，并支持多种应用场景，包括教育、新闻、企业培训和有声书制作等。

AI项目与工具 2025年06月12日 29 点赞 0 评论 925 浏览

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具，通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言，适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景，为内容创作者提供高效且多样化的语音解决方案。

AI项目与工具 2025年06月12日 95 点赞 0 评论 603 浏览

PodLM

PodLM是一款利用先进AI技术打造的播客生成工具，能够将网页内容、文本或文档快速转化为高质量的播客节目。其主要功能包括自动脚本生成、一键式网页转播客、文本转播客以及多样化的AI语音定制选项。PodLM还支持多角色语音合成及背景音乐集成，适用于个人创作者、教育机构、新闻媒体和企业等多个领域，显著提升了内容传播效率。

AI项目与工具 2025年06月12日 61 点赞 0 评论 1649 浏览

文本转语音

首页

文本转语音

列表

默认

浏览次数

发布日期