说话人识别

TurboScribe

TurboScribe是一款利用AI技术实现高效音频和视频转录的服务平台，支持98种以上语言的文本转换，具备强大的文件处理能力和多格式兼容性。通过加密技术保障数据安全，提供多样化的成绩单导出选项，并支持说话人识别功能，广泛应用于播客制作、会议记录、学术研究等领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 644 浏览

3D

3D-Speaker是一个多模态开源项目，专注于通过结合声学、语义和视觉信息，实现高精度的说话人识别和语种识别。其主要功能包括说话人日志、说话人识别、语种识别、多模态识别以及重叠说话人检测。项目提供了工业级模型、训练与推理代码，以及多样化数据集，并支持复杂环境下的语音处理任务。应用场景涵盖会议记录、法庭记录、广播制作、电话客服和安全监控等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 575 浏览

音刻

Inkr 是一款高效的 AI 语音转录工具，支持超过 100 种语言，具备快速转录、多语言支持、说话人识别、高准确率等功能。其“FLASH”模式可在几秒内完成转录，适用于会议记录、采访整理、字幕制作及学习辅助等多种场景，提升信息处理效率。

AI项目与工具 2025年06月11日 47 点赞 0 评论 524 浏览

Riverside

Riverside 是一款 AI 转录工具，允许用户快速可靠地转录 100 多种语言的音频和视频文件。它具有易于使用的界面、出色的准确性、说话人识别功能，并支持多种文件类型。

Ai视频生成 2025年06月05日 25 点赞 0 评论 693 浏览

FunClip

FunClip是一款由阿里巴巴达摩院通义实验室开发的开源、本地部署的视频剪辑工具。它主要通过自动化语音识别技术，帮助用户基于语音转文字的结果，选择特定文本片段或说话人进行视频剪辑。其特点包括高精度的中文ASR模型、热词定制化、说话人识别功能、Gradio交互界面，以及支持多段剪辑和自动生成SRT字幕文件。

AI项目与工具 2024年07月01日 55 点赞 0 评论 736 浏览

Clips AI

Clips AI是一个开源的Python库，专门设计用于自动将长篇视频转换成多个短视频片段，支持将视频的纵横比从16:9调整为9:16。

Ai视频生成 2026年06月29日 0 点赞 0 评论 368 浏览

说话人识别

首页

说话人识别

列表

默认

浏览次数

发布日期

TurboScribe

3D

音刻

Riverside

FunClip

Clips AI

说话人识别 首页 说话人识别

列表 默认 浏览次数 发布日期

TurboScribe

3D

音刻

Riverside

FunClip

Clips AI

说话人识别

首页

说话人识别

列表

默认

浏览次数

发布日期