语音 - 智狐AI导航

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

Ai开源项目 2025年06月05日 42 点赞 0 评论 592 浏览

Ztalk ai

一个AI驱动的会议实时语音翻译平台，可以与 Zoom、Google Meet 等视频会议平台集成。提供超30种语言的即时语音到语音翻译，延迟小于 100 毫秒，具备高级音频处理和企业安全功能。

Ai语音工具 2025年06月05日 30 点赞 0 评论 594 浏览

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具，通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言，适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景，为内容创作者提供高效且多样化的语音解决方案。

AI项目与工具 2025年06月12日 95 点赞 0 评论 595 浏览

WowTo AI

WowTo是一个AI视频制作生成软件，使用AI创建和托管教程视频知识库。你可以用WowTo的视频编辑器制作支持视频、培训视频和教育视频。

Ai视频生成 2025年06月05日 57 点赞 0 评论 595 浏览

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统，基于大量中文语音数据训练，支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能，适用于智能助手、内容创作及无障碍通信等场景，技术上融合了语音-文本联合建模与多阶段训练策略，提升语音表现力与智能化水平。

AI项目与工具 2025年06月12日 23 点赞 0 评论 596 浏览