语音 - 智狐AI导航

MoCha

MoCha 是一款由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型，支持语音与文本驱动的角色动画生成，具备全身动作模拟与多角色对话交互能力。其核心技术包括扩散变压器架构和语音-视频窗口注意力机制，确保动画与语音精准同步。适用于虚拟主播、影视动画、教育内容及数字人客服等多个领域，提升了内容创作效率与表现力。

AI项目与工具 2025年06月12日 34 点赞 0 评论 706 浏览

Enhance Speech

一款由 Adobe 出品的录音增强工具，可以去除音频背景噪音，让语音或者录音听起来就像在专业录音室中录制一样，使音频具有专业录音室品质录音的干净、专业的声音。

Ai语音工具 2025年06月05日 29 点赞 0 评论 707 浏览

音鹿

音鹿是一款基于AI技术的音频编辑工具，主要功能包括文字转语音、音色选择、AI翻唱及音频编辑（剪切、合并、混音、音量调节、变速变调）。该工具内置大量音色模型，支持实时预览与参数调整，广泛适用于社交媒体、广告宣传、教育培训等领域，帮助用户高效完成音频创作。

AI项目与工具 2025年06月12日 73 点赞 0 评论 707 浏览

声动视界SoundView

一款面向带货短视频的AI视频工具，声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。

Ai语音工具 2025年06月05日 58 点赞 0 评论 709 浏览

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 710 浏览

日日新SenseNova V6

日日新SenseNova V6是商汤科技推出的第六代多模态大模型，基于6000亿参数架构，支持文本、图像、视频的原生融合。具备强推理、长记忆与情感表达能力，适用于视频分析、教育辅导、智能客服、具身智能等多个领域，提升交互体验与内容处理效率。

AI项目与工具 2025年06月11日 19 点赞 0 评论 711 浏览

问小白上线DeepSeek

“问小白”平台提供免费且无限使用的DeepSeek R1满血版服务，支持联网搜索、文件上传、多模态处理等功能，运行流畅稳定。平台在多项实测中表现优异，具备深度思考能力、智能追问及语音交互功能，适用于多种场景，用户体验良好，且完全免费。

AI项目与工具 2025年06月12日 12 点赞 0 评论 712 浏览

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别（ASR）模型系列，支持普通话、中文方言和英语，具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本，分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色，且已开源，推动语音识别技术的发展。

AI项目与工具 2025年06月12日 82 点赞 0 评论 713 浏览

木言AI

专注于文字语音合成配音、字幕配音、智能视频创作的全自动化在线工具。制作视频无需出镜，木言AI是新自媒体人必不可少的工具！

Ai语音工具 2025年06月05日 37 点赞 0 评论 713 浏览

TTS-Voice-Wizard

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100...

Ai语音工具 2026年06月10日 0 点赞 0 评论 713 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期