智能语音 - 智狐AI导航

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型，支持实时语音转文本，具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术，适应不同长度的音频输入，计算需求随音频长度变化而调整，适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 636 浏览

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具，用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型，进行歌曲翻唱并生成MV，同时提供变声、音频提取、听歌识曲等功能，适用于娱乐、配音、创作等多种场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 657 浏览

Skyo

Skyo是一款基于天工AI大模型技术的智能语音对话助手，具备快速响应、多语言对话、实时打断、情感化回应及个性化记忆等功能。它能根据用户情绪提供拟人化回复，并支持长时间对话和个性化声音定制。Skyo可应用于情感陪伴、个性化交互、多语言客服、时事新闻聊天、教育辅助和生活助理等多个场景，旨在为用户提供高质量的互动体验。

AI项目与工具 2025年06月12日 61 点赞 0 评论 680 浏览

京东言犀

京东言犀是一个集成了多种智能服务和AI技术的交互平台，旨在通过情感机器人、智能语音服务、知识库管理等功能，为企业提供一个全面的数智化服务解决方案。

Ai平台模型 1970年01月01日 0 点赞 0 评论 699 浏览

知存科技

专注研发基于存算一体先进技术的人工智能芯片

创作工具 1970年01月01日 0 点赞 0 评论 723 浏览

Amphion

Amphion是一款开源音频生成工具包，包含文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）和文本转音乐（TTM）等功能。它支持多种神经声码器，并提供可视化模型架构，帮助用户快速掌握音频生成技术。通过统一框架和预训练模型，Amphion推动了音频生成领域的研究和应用发展。

AI项目与工具 2025年06月12日 63 点赞 0 评论 727 浏览

网易见外

网易见外是由网易人工智能事业部研发的AI智能语音转写听翻平台，提供视频听翻、直播听翻、语音转写、文档直翻等功能。

Ai语音工具 1970年01月01日 0 点赞 0 评论 779 浏览

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 790 浏览

Gemini Live

Gemini Live是一款由谷歌开发的智能语音助手，拥有自然语言理解和多模态识别能力，支持语音、图像和视频交互。其主要功能包括自然语言对话、多模态识别、个性化语音选择、任务自动化以及智能打断和续接。此外，Gemini Live还与谷歌的原生应用深度集成，提升用户体验。目标用户包括商务人士、技术探索者、多语言用户、创意人士和老年人。

AI项目与工具 2025年06月12日 13 点赞 0 评论 811 浏览

Imagine Explainers

Imagine Explainers 是一款基于 AI 的视频生成工具，支持用户根据主题和时长快速生成高质量动画视频。提供多种模板、角色和风格选择，支持 AI 语音或自定义音频。适用于教育、商业、营销等多个领域，能够将复杂内容转化为直观的视觉表达，提升信息传达效率。

AI项目与工具 2025年06月11日 85 点赞 0 评论 811 浏览

智能语音

首页

智能语音

列表

默认

浏览次数

发布日期