语音识别

PyVideoTrans

PyVideoTrans是一款开源的视频翻译配音工具,支持多语言处理,利用先进的语音识别和翻译技术,实现视频内容的自动翻译,并添加自然流畅的配音和同步字幕。该工具适用于影视后期、教育、企业宣传及自媒体创作等场景,帮助内容创作者跨越语言障碍,扩大受众群体。

Zeemo.ai

Zeemo,这是一款快速的 AI 字幕工具,可以为您的视频自动生成和翻译字幕。

星火陪练

星火陪练是一款基于AI技术的企业员工培训平台,集智能配置、自然对话、虚拟陪练及多维评分于一体。其主要功能包括快速生成课程内容、场景模拟对话、沉浸式虚拟陪练以及多维度评价反馈,广泛应用于企业培训、新员工入职、技能提升及在线教育等领域,助力员工高效掌握专业知识与实践技能。

悦录

悦录依托同花顺的语音识别技术,为用户提供免费的录音转文字、语音转文字、视频字幕等服务,1小时音频最快5分钟出稿,准确率高达97%+,全程加密,文件信息安全。

爱幕字幕编辑器

一款在线免费字幕编辑器,爱幕其核心优势在于提供了全面的字幕处理功能,支持视频转码、语音识别、字幕翻译和一键字幕压制等。

Whisper

Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练

RTranslator

RTranslator是一款基于AI技术的开源、免费离线翻译应用,专为Android设备设计。它支持对话模式、对讲机模式及文本翻译功能,能够实现高质量的多语言实时翻译。RTranslator采用Meta的NLLB翻译模型和OpenAI的Whisper语音识别技术,支持多种语言,完全离线运行,保障用户隐私安全。

易途AI面试官

易途AI面试官是一款基于AI技术的模拟面试工具,支持多种岗位和行业,提供真实面试场景、智能追问及多维度评估功能。它能帮助求职者提升面试技巧,同时为企业提高招聘效率和精准度,具备个性化练习与流程优化等特点。

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具,支持将音频中不同说话人的语音精准分离至独立轨道,适用于广播级音频处理。它具备高保真音频处理能力,支持高采样率,能处理长达数小时的录音,在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域,提升音频编辑效率与质量。