语音识别

VideoTrans

一个开源的视频翻译和配音工具,VideoTrans能够一键识别视频字幕、翻译成其他语言以及进行多种语音合成,最终输出带字幕和配音的目标语言的视频。

爱幕字幕编辑器

一款在线免费字幕编辑器,爱幕其核心优势在于提供了全面的字幕处理功能,支持视频转码、语音识别、字幕翻译和一键字幕压制等。

Zeemo.ai

Zeemo,这是一款快速的 AI 字幕工具,可以为您的视频自动生成和翻译字幕。

突字幕

几分钟内得到字幕-极速识别文字和画面提取字幕

绘影字幕

为视频自动添加字幕,自动识别视频中的人声,转化成字幕,字幕翻译,字幕制作软件

讯飞听见字幕

一款基于科大讯飞语音识别技术的AI视频字幕制作软件,提供视频加字幕、自动添加字幕、视频翻译等。

Arctime

简单、强大、高效的跨平台字幕制作软件

TEN VAD

TEN VAD是一款高性能的实时语音活动检测系统,专为企业级应用设计。它基于深度学习技术,能够精确区分语音和非语音信号,具有低延迟、轻量级和高精度的特点。支持多种平台和编程接口,适用于智能助手、客服机器人等场景,帮助构建更高效、更智能的对话系统。

CoGenAV

CoGenAV是一种先进的多模态学习模型,专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练,利用同步音频、视频和文本数据,学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能,适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。