语音识别 - 智狐AI导航

PyVideoTrans

PyVideoTrans是一款开源的视频翻译配音工具，支持多语言处理，利用先进的语音识别和翻译技术，实现视频内容的自动翻译，并添加自然流畅的配音和同步字幕。该工具适用于影视后期、教育、企业宣传及自媒体创作等场景，帮助内容创作者跨越语言障碍，扩大受众群体。

AI项目与工具 2025年06月12日 100 点赞 0 评论 792 浏览

面试狗

AI面试辅助工具是一款面向求职者的智能应用，支持语音识别、智能回答建议、多模式回答及简历关联等功能，帮助用户提升面试与笔试表现。用户可上传简历、截图题目，AI将生成针对性建议。工具支持多种使用方式，记录完整面试对话，便于复盘总结。适用于线上面试、双机位面试、在线笔试等多种场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 796 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 800 浏览

Zeemo.ai

Zeemo，这是一款快速的 AI 字幕工具，可以为您的视频自动生成和翻译字幕。

字幕配音 2025年06月05日 97 点赞 0 评论 801 浏览

易途AI面试官

易途AI面试官是一款基于AI技术的模拟面试工具，支持多种岗位和行业，提供真实面试场景、智能追问及多维度评估功能。它能帮助求职者提升面试技巧，同时为企业提高招聘效率和精准度，具备个性化练习与流程优化等特点。

AI项目与工具 2025年06月12日 29 点赞 0 评论 802 浏览

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 804 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 811 浏览

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Ai语音工具 1970年01月01日 0 点赞 0 评论 819 浏览

星火语音同传大模型

星火语音同传大模型是科大讯飞推出的国内首个端到端语音同传AI系统，支持37种语言，具备高精度翻译、流式处理、语境理解和语音合成优化等功能。模型可在5秒内完成同传，准确度高，适用于国际会议、商务交流、教育等场景，支持译文长度调节和设备兼容，提升跨语言沟通效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 826 浏览

本文介绍了15款基于人工智能技术的视频翻译工具，这些工具能够实现精准的语音识别、自然语言处理和机器学习，从而将视频内容从一种语言翻译成另一种语言，为全球观众提供无缝的语言转换体验。这些工具涵盖了多语言支持、精准翻译与文化适配、字幕与音频同步、自动对口型和重新配音、智能视频去文字、翻译视频文字、视频翻译精校版、支持多种语言、字幕调整和声音克隆等多个功能和特点，极大地提升了视频内容的本地化质量和传播效

AI项目与工具 2025年06月12日 52 点赞 0 评论 835 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期