语音 - 智狐AI导航

Pinch

Pinch 是一款基于 AI 的实时语音翻译视频会议平台，支持超过 30 种语言，提供口译和同声传译两种模式，满足多样化的沟通需求。其核心优势在于无需字幕即可实现自然流畅的语音翻译，具备低延迟和文化敏感性处理能力，适用于国际商务、教育、家庭沟通及客户服务等场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 542 浏览

Multimodal Live API

Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口，具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动，并支持会话记忆和外部功能调用，广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 542 浏览

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件，Memo都能轻松将其转换为文本并提炼精华。

Ai语音工具 2026年06月10日 0 点赞 0 评论 540 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 539 浏览

交交

交交是上海交通大学研发的口语对话情感大模型，支持多人对话、多语言交流、方言识别、角色扮演、情感互动及知识问答。具备端到端语音处理、多语言理解、实时音色克隆等功能，适用于教育、家庭、商务、客服等多个场景，展现出强大的语音交互能力与应用潜力。

AI项目与工具 2025年06月11日 12 点赞 0 评论 539 浏览

音品汇配音

为用户提供文字转语音在线转化服务，文字转语音准确率达99%

字幕配音 2025年06月05日 61 点赞 0 评论 538 浏览

Koko AI

一款具有AI生成的3D模型和语音聊天功能的社交娱乐应用，Koko AI融合了3D模型、动画表演和语音聊天技术，为用户提供了与动漫角色进行面对面的互动体验。

生活创意 2025年06月05日 87 点赞 0 评论 538 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 536 浏览

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型，能够处理音频、图像、视频和文本等多种输入，并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色，具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练，结合高质量音频数据提升性能，并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 535 浏览

Lyra

Lyra是一款由香港中文大学、SmartMore和香港科技大学联合研发的高效多模态大型语言模型（MLLM）。它通过整合视觉、语音和文本三种模态的信息，实现了强大的跨模态理解和推理能力。Lyra不仅擅长处理长语音数据，还支持流式文本-语音生成及跨模态信息交互，适用于智能助手、客户服务、教育培训、医疗健康等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 535 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期