语音识别 - 智狐AI导航

易途AI面试官

易途AI面试官是一款基于AI技术的模拟面试工具，支持多种岗位和行业，提供真实面试场景、智能追问及多维度评估功能。它能帮助求职者提升面试技巧，同时为企业提高招聘效率和精准度，具备个性化练习与流程优化等特点。

AI项目与工具 2025年06月12日 29 点赞 0 评论 802 浏览

Zeemo.ai

Zeemo，这是一款快速的 AI 字幕工具，可以为您的视频自动生成和翻译字幕。

字幕配音 2025年06月05日 97 点赞 0 评论 801 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 800 浏览

面试狗

AI面试辅助工具是一款面向求职者的智能应用，支持语音识别、智能回答建议、多模式回答及简历关联等功能，帮助用户提升面试与笔试表现。用户可上传简历、截图题目，AI将生成针对性建议。工具支持多种使用方式，记录完整面试对话，便于复盘总结。适用于线上面试、双机位面试、在线笔试等多种场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 796 浏览

PyVideoTrans

PyVideoTrans是一款开源的视频翻译配音工具，支持多语言处理，利用先进的语音识别和翻译技术，实现视频内容的自动翻译，并添加自然流畅的配音和同步字幕。该工具适用于影视后期、教育、企业宣传及自媒体创作等场景，帮助内容创作者跨越语言障碍，扩大受众群体。

AI项目与工具 2025年06月12日 100 点赞 0 评论 792 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 791 浏览