语音

绘影字幕

为视频自动添加字幕,自动识别视频中的人声,转化成字幕,字幕翻译,字幕制作软件

Martin

Martin是一款由大学生团队开发的人工智能助手,支持语音交互与多平台通信,具备日程管理、邮件处理、任务跟踪、文件管理等功能。它通过自定义记忆架构理解用户偏好,提供个性化服务,适用于日常办公和生活管理,提升工作效率与便利性。

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。

鸭鸭配音

一个在线配音网站,是目前为数不多的免费的在线文字转语音的配音神器,用户只需输入文本,即可生成高度拟人的智能配音。

悦录

悦录依托同花顺的语音识别技术,为用户提供免费的录音转文字、语音转文字、视频字幕等服务,1小时音频最快5分钟出稿,准确率高达97%+,全程加密,文件信息安全。

配音神器PRO

配音神器官网_文字转语音神器_配音神器pro_语音合成软件_专业配音神器_AI配音神器

TIGER

TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

​LobeChat

一个开源、高性能的聊天机器人框架,支持语音合成、多模态和可扩展(函数调用)插件系统。支持一键免费部署您的私人 ChatGPT/LLM Web 应用程序。

moemate

Moemate是一款集成了多语言对话、屏幕感知、语音克隆和自定义图像模型等功能的AI角色平台。它支持用户创建个性化AI伴侣,并兼容多种语言模型和操作系统。Moemate不仅提供娱乐体验,还具备教育辅助、信息查询和工作效率提升等实用功能,适合个人和企业用户。