无障碍

SONIFY.io

Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案。

Dupdub AI

一个在线的将文本转换为逼真的人类语音AI工具,拥有超过400种语音选项,您可以轻松创建逼真的音频内容。DupDub语音生成器可用于内容创作、无障碍性、语言学习、虚拟助理、游戏和动画。

Cockatoo

一款由AI驱动的语音转文字服务,能够在几秒钟内将音频或视频文件转换为文字或字幕。

沉浸式翻译

沉浸式翻译,同时支持 PDF 翻译,双语 Epub 电子书制作,支持 Deepl/Google/有道/腾讯翻译等多个翻译服务,免费使用。

银河录像局

Midjourney账号购买与开通,服务由第三方提供,如有相关问题可联系第三方。

颜色代码表

一款为设计师和开发者提供专业的色彩工具,提供的调色板集实用性与创意性于一体,颜色代码表帮助设计师和开发者创造优秀的作品。

Vocloner

Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数

ChatUI

ChatUI 是阿里团队推出的开源智能对话 UI 组件库,支持快速构建高质量聊天应用。具备响应式设计、多语言支持、主题定制、无障碍功能及 TypeScript 开发优势,适用于客服、智能助手、社交平台等多种场景,提升开发效率与用户体验。

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型,支持图像与语音的自然交互。它基于Moshi 7B架构,集成了视觉编码器和跨注意力机制,实现低延迟、自然流畅的对话体验。支持多种后端部署,适用于无障碍应用、智能家居、教育及工业场景,提升人机交互的智能化水平。

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具,支持100多种语言,具备自动编辑、上下文感知和低音量识别等功能,提升写作与沟通效率。提供免费基础版及付费专业版和团队版,适用于写作、商务、学习等多种场景,注重用户隐私保护,操作便捷自然。