语音 - 智狐AI导航

VoiceDub

VoiceDub 是一款AI驱动的音频处理平台，支持人声替换、声音克隆、文本转语音及音频分离等功能，提供超过10,000种AI人声音色。用户可通过平台进行音乐创作、有声内容制作及个性化音频生成，适用于多种应用场景，如语言学习、娱乐互动等。

AI项目与工具 2025年06月12日 57 点赞 0 评论 571 浏览

covers.ai

covers.ai是一款基于AI技术的音乐创作平台，提供AI语音生成与AI歌曲生成功能。用户可通过简单操作，如演唱或哼唱，由AI自动完成音乐制作，生成个性化歌曲。平台支持多种音乐风格，并允许用户自定义声音效果，适合音乐爱好者、初学者及创作者使用。其操作便捷、创意性强，有助于激发音乐灵感并提升创作效率。

AI项目与工具 2025年06月12日 31 点赞 0 评论 630 浏览

VideoCaptioner

VideoCaptioner是一款基于大语言模型的智能字幕处理工具，支持语音识别、字幕优化、翻译、样式调整及视频合成等功能。无需GPU即可运行，兼容多语言和多种字幕格式，适用于视频创作者、教育工作者及字幕翻译团队，提升字幕制作效率与质量。

AI项目与工具 2025年06月12日 50 点赞 0 评论 672 浏览

Zonos

Zonos是一款由Zyphra开发的高保真文本到语音（TTS）模型，支持零样本语音克隆和多语言生成，具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构，基于大规模语音数据训练，适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 549 浏览

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具，提供300多种真实语音选择，生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景，操作简单，支持多种音频格式下载，并可合法用于商业用途。凭借AI技术，用户能高效完成语音内容制作，满足多样化需求。

AI项目与工具 2025年06月12日 20 点赞 0 评论 560 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 524 浏览

星声AI

星声AI是一款智能化播客生成工具，支持文字、网页链接或文档输入，自动生成结构完整的播客脚本，并通过高质量语音合成技术转化为自然流畅的音频内容。平台支持中、英、日、韩四国语言，提供多种音色与风格选择，具备音频编辑、内容拆解、多平台发布等功能，适用于知识分享、企业培训、内容创作等多种场景。

AI项目与工具 2025年06月12日 21 点赞 0 评论 782 浏览

问小白上线DeepSeek

“问小白”平台提供免费且无限使用的DeepSeek R1满血版服务，支持联网搜索、文件上传、多模态处理等功能，运行流畅稳定。平台在多项实测中表现优异，具备深度思考能力、智能追问及语音交互功能，适用于多种场景，用户体验良好，且完全免费。

AI项目与工具 2025年06月12日 12 点赞 0 评论 712 浏览

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 842 浏览

FoloUp

FoloUp 是一款开源的 AI 语音面试平台，能根据职位描述自动生成面试问题，并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成，提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘，结合语音识别、NLP 和安全数据管理技术，适用于多种招聘场景，提升招聘效率与质量。

AI项目与工具 2025年06月12日 74 点赞 0 评论 757 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期