无障碍

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统,专注于中文语音合成,支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法,结合汉字与拼音,提升发音准确性。系统具备零样本语音克隆能力,音质优秀,广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富,性能指标优异,包括低字词错误率、高扬声器相似性和高主观音质评分。

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具,支持100多种语言,具备自动编辑、上下文感知和低音量识别等功能,提升写作与沟通效率。提供免费基础版及付费专业版和团队版,适用于写作、商务、学习等多种场景,注重用户隐私保护,操作便捷自然。

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型,支持图像与语音的自然交互。它基于Moshi 7B架构,集成了视觉编码器和跨注意力机制,实现低延迟、自然流畅的对话体验。支持多种后端部署,适用于无障碍应用、智能家居、教育及工业场景,提升人机交互的智能化水平。

ChatUI

ChatUI 是阿里团队推出的开源智能对话 UI 组件库,支持快速构建高质量聊天应用。具备响应式设计、多语言支持、主题定制、无障碍功能及 TypeScript 开发优势,适用于客服、智能助手、社交平台等多种场景,提升开发效率与用户体验。

Vocloner

Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数

颜色代码表

一款为设计师和开发者提供专业的色彩工具,提供的调色板集实用性与创意性于一体,颜色代码表帮助设计师和开发者创造优秀的作品。

银河录像局

Midjourney账号购买与开通,服务由第三方提供,如有相关问题可联系第三方。

沉浸式翻译

沉浸式翻译,同时支持 PDF 翻译,双语 Epub 电子书制作,支持 Deepl/Google/有道/腾讯翻译等多个翻译服务,免费使用。

Cockatoo

一款由AI驱动的语音转文字服务,能够在几秒钟内将音频或视频文件转换为文字或字幕。

Dupdub AI

一个在线的将文本转换为逼真的人类语音AI工具,拥有超过400种语音选项,您可以轻松创建逼真的音频内容。DupDub语音生成器可用于内容创作、无障碍性、语言学习、虚拟助理、游戏和动画。