语音

心辰Lingo语音大模型

实现了从语音输入到语音输出的全程无缝对接,心辰Lingo能够直接理解语音内容,捕捉语气、节奏和情绪,并以同样丰富的语音形式进行回复。

Coze on WeChat

一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。

卡卡字幕助手 | VideoCaptioner

一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理!

Linly

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

YouDub

一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。

Omnivore

一款免费、开源、适合认真阅读的稍后阅读应用程序。不受干扰。注重隐私。开源。专为知识工作者和终身学习者而设计。

Media2Face

一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。

Audio2Face

一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

DreamTalk

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。