FunASR FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包,涵盖语音识别(ASR)、语音活动检测(VAD)、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调,并提供预训练模型和易用接口,便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能,广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。 AI项目与工具 2025年06月12日 99 点赞 0 评论 434 浏览
Multi Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具,支持将音频中不同说话人的语音精准分离至独立轨道,适用于广播级音频处理。它具备高保真音频处理能力,支持高采样率,能处理长达数小时的录音,在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域,提升音频编辑效率与质量。 AI项目与工具 2025年06月12日 55 点赞 0 评论 483 浏览
Eleven v3 Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。 AI项目与工具 2025年06月11日 65 点赞 0 评论 247 浏览
多说 雅思口语、写作提分神器,主打出分快!口语 1对1 智能练习,个性化提 作文一键纠错、润色和提分建议3. AI 模考评分,实时掌握你的备考进度。 教育学习 2025年06月05日 44 点赞 0 评论 455 浏览
Vozo Vozo作为一个创新的AI视频编辑工具,通过其强大的脚本重写、声音编辑和口型同步功能,为用户提供了一个简单、高效的视频内容更新和本地化解决方案。 Ai视频生成 1970年01月01日 0 点赞 0 评论 0 浏览