语音识别 - 智狐AI导航

VAPI

VAPI是一个面向开发者的语音AI平台，凭借其简便的API集成、高精度语音识别、多语言支持以及定制化能力，能够协助开发者快速将语音技术嵌入至不同类型的软件应用中。它注重数据隐私与安全性，并提供多样化的应用场景，如智能助手、客户服务自动化、教育培训、医疗健康及呼叫中心等，帮助企业提升运营效率和服务质量。

AI项目与工具 2025年06月12日 91 点赞 0 评论 588 浏览

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集，涵盖202位75岁以上老人的55.53小时语音数据，覆盖16个省市，包含多种口音。数据通过两两自发对话采集，内容贴近真实交流场景，并附有多维标注，如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究，支持适老化设备、健康管理和辅助养老系统的开发，推动相关技术进步。

AI项目与工具 2025年06月12日 71 点赞 0 评论 587 浏览

海豚配音

一款集逼真效果、丰富音色和细腻情感于一体的全能AI配音平台。拥有超过500种栩栩如生的真人音色和1000多种独具特色的二次元音色。

字幕配音 2025年06月05日 35 点赞 0 评论 574 浏览

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具，支持实时语音转文字功能，具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型，可处理中英文混合语音，并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景，同时确保用户数据的安全与隐私。 ---

AI项目与工具 2025年06月12日 38 点赞 0 评论 574 浏览

青梧字幕

青梧字幕是一款基于AI语音识别技术的字幕提取工具，能够从视频中精准提取语音内容并生成时间轴字幕。支持多语言识别、多格式导出及多语种翻译，适用于视频创作者、外语学习者及字幕团队。所有数据处理在本地完成，保障隐私安全，兼容Windows和MacOS系统，提升字幕制作效率。

AI项目与工具 2025年06月12日 90 点赞 0 评论 572 浏览

讯飞听见字幕

一款基于科大讯飞语音识别技术的AI视频字幕制作软件，提供视频加字幕、自动添加字幕、视频翻译等。

字幕配音 2025年06月05日 67 点赞 0 评论 571 浏览

CoGenAV

CoGenAV是一种先进的多模态学习模型，专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练，利用同步音频、视频和文本数据，学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能，适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

AI项目与工具 2025年06月11日 80 点赞 0 评论 570 浏览

WhisperChain

WhisperChain 是一款开源语音识别工具，支持实时语音转文本并提供文本优化功能，可去除填充词、优化语法。用户可通过全局热键快速启动语音输入，处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构，适用于会议记录、写作辅助等场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 569 浏览

Amurex

Amurex是一款基于AI技术的会议助手，支持实时建议、智能摘要生成、关键要点提取及会议记录功能。它通过自然语言处理、机器学习和语音识别等技术，实现会议内容的高效管理和总结。适用于企业会议、远程协作、教育培训及项目管理等多种场景，帮助企业提升会议效率并保障数据安全。

AI项目与工具 2025年06月12日 93 点赞 0 评论 569 浏览

Linly

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

Ai开源项目 2025年06月05日 38 点赞 0 评论 568 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期