语音识别 - 智狐AI导航

交交

交交是上海交通大学研发的口语对话情感大模型，支持多人对话、多语言交流、方言识别、角色扮演、情感互动及知识问答。具备端到端语音处理、多语言理解、实时音色克隆等功能，适用于教育、家庭、商务、客服等多个场景，展现出强大的语音交互能力与应用潜力。

AI项目与工具 2025年06月11日 12 点赞 0 评论 500 浏览

Nova Sonic

Nova Sonic是亚马逊推出的生成式AI语音模型，集成语音理解和生成功能，支持多种语言和口音，具备高准确性与自然对话能力。其采用HiFi语音识别技术，平均单词错误率低至4.2%，支持实时信息获取与请求路由，适用于客户服务、教育、医疗、旅游及娱乐等多个领域。该模型具备低延迟和高性价比优势，是当前市场上较为突出的语音处理工具。

AI项目与工具 2025年06月12日 61 点赞 0 评论 465 浏览

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集，涵盖202位75岁以上老人的55.53小时语音数据，覆盖16个省市，包含多种口音。数据通过两两自发对话采集，内容贴近真实交流场景，并附有多维标注，如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究，支持适老化设备、健康管理和辅助养老系统的开发，推动相关技术进步。

AI项目与工具 2025年06月12日 71 点赞 0 评论 587 浏览

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集，包含41.25小时高质量语音，覆盖全国22个省市。数据通过家长引导式对话采集，保证自然真实。该数据集支持语音识别、说话人验证和语言研究，适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域，为儿童语音技术研究提供重要资源。

AI项目与工具 2025年06月12日 28 点赞 0 评论 541 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 811 浏览

面试狗

AI面试辅助工具是一款面向求职者的智能应用，支持语音识别、智能回答建议、多模式回答及简历关联等功能，帮助用户提升面试与笔试表现。用户可上传简历、截图题目，AI将生成针对性建议。工具支持多种使用方式，记录完整面试对话，便于复盘总结。适用于线上面试、双机位面试、在线笔试等多种场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 796 浏览

易途AI面试官

易途AI面试官是一款基于AI技术的模拟面试工具，支持多种岗位和行业，提供真实面试场景、智能追问及多维度评估功能。它能帮助求职者提升面试技巧，同时为企业提高招聘效率和精准度，具备个性化练习与流程优化等特点。

AI项目与工具 2025年06月12日 29 点赞 0 评论 802 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 497 浏览

Soundwave

Soundwave是由香港中文大学（深圳）开发的开源语音理解大模型，专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术，提升语音特征压缩效率，支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域，具有广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 619 浏览

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具，支持将音频中不同说话人的语音精准分离至独立轨道，适用于广播级音频处理。它具备高保真音频处理能力，支持高采样率，能处理长达数小时的录音，在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域，提升音频编辑效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 778 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期

交交