语音

Aider

Aider 是一款开源 AI 编程辅助工具,支持多语言开发,集成多种大型语言模型,通过命令行实现代码编辑、自动提交和多文件处理。具备语音编程、图片交互等功能,提升开发效率。适用于新项目搭建、代码修复、重构及团队协作,支持与主流 IDE 集成,提供流畅的开发体验。

瓦兔漫剪工厂

一款帮助漫剪达人制作漫剪视频的辅助软件,其中集成文字转语音、频文字提取、漫画对白遮挡,自动搭配画面转场、音效、背景音乐等众多漫画剪辑功能,是一款漫剪小白也能一键使用的漫剪神器。

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件,Memo都能轻松将其转换为文本并提炼精华。

easegen

Easegen 是一款开源的 AI 工具,支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音,并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆,旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等,适用于在线教育、企业培训、学术研究、语言学习及职业培训

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具,提供300多种真实语音选择,生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景,操作简单,支持多种音频格式下载,并可合法用于商业用途。凭借AI技术,用户能高效完成语音内容制作,满足多样化需求。

猫头音

猫头音是一款基于深度学习技术的AI配音与翻唱工具,支持将文字转化为高质量语音输出,并提供多样化音色选择及丰富的音频处理功能。用户可通过简单操作实现个性化配音、修音翻唱以及音频编辑,广泛适用于视频创作、广告制作、有声读物开发及音乐翻唱等多个领域。

Ichigo

Ichigo是一款开源的多模态AI语音助手,采用混合模态模型,支持实时处理语音和文本交织序列。它通过统一的Transformer架构实现跨模态联合推理,提供低延迟的实时性能,并支持多语言、多轮对话及模糊输入处理。Ichigo适用于智能家居、个人助理、客户服务、教育和健康咨询等多种应用场景,展现了高效、灵活的技术优势。

熊猫字幕

一款专业的在线字幕网站,提供自动在线字幕生成,视频音频字幕生成,字幕制作,语音转字幕,语音自动生成字幕,字幕翻译,字幕格式转换等各种字幕功能。

ChatGPT Windows客户端

ChatGPT Windows客户端是一款为Windows用户打造的桌面应用程序,支持快捷键调用、截图发送、文件上传、图片拖拽、对话搜索及语音交互等功能。它旨在提升用户的工作效率,涵盖学术研究、编程开发、内容创作、客户服务和语言学习等多个领域。目前处于测试阶段,未来将全面开放。