语音

Boardy

Boardy是一款基于AI与语音技术的人脉拓展工具,通过智能对话了解用户需求并提供精准推荐。支持双向确认连接,提升合作质量。内置数据可视化模块,用户可轻松创建自动更新的仪表板,适用于创业者、高管及企业用户,助力资源拓展与职业发展。

MARS5

MARS5-TTS是一款开源的AI声音克隆工具,支持140多种语言的文本转语音功能。它能够生成高度逼真的语音,并处理复杂的韵律场景。该工具拥有12亿参数,基于超过15万小时的训练数据。用户可以通过文本中的标点符号和大小写等标记引导语音的韵律和情感,同时提供快速克隆和深度克隆两种模式。MARS5-TTS可应用于内容创作、语言学习、辅助技术、客户服务和多媒体娱乐等多种场景。

思必驰 DFM

思必驰 DFM-2 大模型作为思必驰的自研对话式语言大模型,展现了其在多模态交互和行业应用中的潜力。它通过结合先进的AI技术,为用户提供了更加智能化和个性化的体验,推动了智能语...

Multimodal Live API

Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口,具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动,并支持会话记忆和外部功能调用,广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。

交交

交交是上海交通大学研发的口语对话情感大模型,支持多人对话、多语言交流、方言识别、角色扮演、情感互动及知识问答。具备端到端语音处理、多语言理解、实时音色克隆等功能,适用于教育、家庭、商务、客服等多个场景,展现出强大的语音交互能力与应用潜力。

Shadow

Shadow是一款智能会议助手,支持自动转录、语音识别、会议记录生成及关键信息提取等功能,帮助用户提升会议效率和执行力。其核心优势包括本地数据处理、隐私保护、与主流会议平台集成以及自动化任务执行能力。适用于销售、项目管理、市场分析及客户服务等多个场景,是提升团队协作效率的实用工具。

Dubverse.ai

只需单击一个按钮,即可使您的内容支持多种语言,并覆盖更多人。

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件,Memo都能轻松将其转换为文本并提炼精华。

Speechnotes

Speechnotes是一款基于AI的语音转文字工具,提供高精度语音识别、实时语音输入、语音命令支持、自动大写处理等功能,支持多平台操作(Chrome扩展、Android、iOS、API等)。它强调隐私保护,录音不经过人工处理且自动删除,适合快速转录、会议记录、写作、医疗记录等多种应用场景,是提升工作效率的理想选择。