SpeechEasy SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单... Ai语音工具 1970年01月01日 0 点赞 0 评论 480 浏览
MagicMic MagicMic是一个功能强大的声音变换工具,适用于游戏玩家、主播和内容创作者。它通过提供丰富的声音过滤器和音效,以及实时声音变换技术,使用户能够在游戏中或在线聊天中保护隐私... 创作工具 1970年01月01日 0 点赞 0 评论 479 浏览
Nuance Nuance公司以其在对话式AI领域的专业知识,为医疗保健和客户参与提供创新解决方案。公司致力于通过AI技术推动组织效能,提升工作成效,并在全球范围内产生积极影响。 Ai语音工具 1970年01月01日 0 点赞 0 评论 477 浏览
OpenVoice OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具,其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色,生成自然流畅的语音,并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行,也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。 AI项目与工具 2025年06月12日 49 点赞 0 评论 472 浏览
Vocloner Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数 AI项目与工具 2025年06月11日 47 点赞 0 评论 471 浏览
ChatTTS ChatTTS是一个开源的专为对话场景设计的语音生成模型,特别适用于大语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文,英文也能 hold 住... 创作工具 1970年01月01日 0 点赞 0 评论 468 浏览
Parakeet TDT 0.6B Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别(ASR)模型,采用 FastConformer 和 TDT 架构,具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异,实时因子高达 3386,适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。 AI项目与工具 2025年06月11日 36 点赞 0 评论 465 浏览
Revid AI Revid AI 是一款AI驱动的视频生成工具,支持从脚本创作到视频发布的全流程操作。用户可输入创意自动生成视频内容,涵盖多种风格与语言模板,具备简单易用的编辑功能及一键发布能力。适用于社交媒体、品牌营销、教育分享及电商展示等多个场景,提升内容创作效率与传播效果。 AI项目与工具 2025年06月12日 18 点赞 0 评论 459 浏览