语音

Open Voice OS

一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

Speechki

Speechki 是一款高效文本转语音工具,支持多语言和多种语音选择,具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高,适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成,提升文本转音频的效率和实用性。

Linly

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

MagicMic

MagicMic是一个功能强大的声音变换工具,适用于游戏玩家、主播和内容创作者。它通过提供丰富的声音过滤器和音效,以及实时声音变换技术,使用户能够在游戏中或在线聊天中保护隐私...

Freed

Freed是一款基于AI技术的医疗文档助手,通过语音转录和自然语言处理技术,实现医患对话的自动化记录与结构化文档生成。其核心功能包括环境感知技术、个性化学习以及多语言支持,广泛适用于门诊、住院、急诊及远程医疗等多种医疗场景,旨在减轻医生文书负担,提升工作效率。

VAPI

VAPI是一个面向开发者的语音AI平台,凭借其简便的API集成、高精度语音识别、多语言支持以及定制化能力,能够协助开发者快速将语音技术嵌入至不同类型的软件应用中。它注重数据隐私与安全性,并提供多样化的应用场景,如智能助手、客户服务自动化、教育培训、医疗健康及呼叫中心等,帮助企业提升运营效率和服务质量。

OfferinAI

OfferinAI是一款面向求职者和招聘者的智能工具,集成了实时语音识别、快速响应、网络搜索及代码生成等功能,旨在提升用户在面试和笔试中的表现。它支持多种模式,适用于在线面试、笔试辅助、技能测试及模拟面试等场景,帮助用户在多轮面试中获得竞争优势。

Verbalate Ai

Verbalate是一款通用的视频翻译和唇语同步工具,能够轻松地将音频/视频内容转换为多种语言,并具备语音克隆和唇语同步功能。

​33搜帧

​33搜帧是一个可以通过文本描述来搜索视频画面的工具

speakSync

AI语音翻译器,无缝语音和文本转换,一款基于ChatGPT的AI语音翻译应用,支持70多种语言。它可以实现面对面语音通话。