语音助手 - 智狐AI导航

edge

edge-tts 是一个开源的AI文字转语音项目，支持超过40种语言和300多种声音。该项目利用微软Azure Cognitive Services技术，能够将文本信息转换为流畅自然的语音输出。edge-tts 提供了丰富的语言和声音选择，易于集成且具有高度可定制性。其主要功能包括多语言支持、多样声音选择、流畅自然语音、易于集成的API以及开源特性。edge-tts 广泛应用于辅助技术、客户服务、

AI项目与工具 2025年06月12日 86 点赞 0 评论 704 浏览

Speechki

Speechki 是一款高效文本转语音工具，支持多语言和多种语音选择，具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高，适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成，提升文本转音频的效率和实用性。

AI项目与工具 2025年06月12日 50 点赞 0 评论 660 浏览

Huxe AI

Huxe AI是一款基于生成式AI技术的个人音频伴侣应用，旨在为用户提供高度个性化的音频体验。其主要功能包括个性化音频简报、实时问答、减少屏幕时间以及与现有应用的无缝集成。通过连接用户的日历、邮件等数据流，Huxe AI能够生成定制化的语音内容，帮助用户高效管理日程、获取信息并提升学习效率。

AI项目与工具 2025年06月12日 76 点赞 0 评论 648 浏览

F5

F5-TTS是一款由上海交通大学研发的高性能文本转语音（TTS）系统，采用流匹配与扩散变换器技术，支持多语言合成及情感控制等功能。它能够在无额外监督条件下生成高质量语音，适用于多种商业和非商业场景，如有声读物、语音助手、语言学习等。

AI项目与工具 2025年06月12日 29 点赞 0 评论 645 浏览

Ichigo

Ichigo是一款开源的多模态AI语音助手，采用混合模态模型，支持实时处理语音和文本交织序列。它通过统一的Transformer架构实现跨模态联合推理，提供低延迟的实时性能，并支持多语言、多轮对话及模糊输入处理。Ichigo适用于智能家居、个人助理、客户服务、教育和健康咨询等多种应用场景，展现了高效、灵活的技术优势。

AI项目与工具 2025年06月12日 96 点赞 0 评论 631 浏览

Weebo

Weebo是一款基于AI技术的实时语音交互工具，支持语音识别与生成，实现自然流畅的语音对话。具备多语言支持和实时响应能力，适用于个人助理、娱乐互动和教育辅导等场景。技术上融合了Whisper Small、Llama 3.2等模型，提供便捷高效的语音交互体验。

AI项目与工具 2025年06月12日 72 点赞 0 评论 628 浏览

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 610 浏览

听脑AI

听脑AI是一款AI智能语音助手，专注于语音转文本和实时录音总结，提供音视频转文字、实时录音转文本、AI总结、章节速览等功能。用户可以通过自由拖动文本查看音视频进度，享受便捷...

创作工具 2026年06月30日 0 点赞 0 评论 609 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 580 浏览

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型，能够处理音频、图像、视频和文本等多种输入，并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色，具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练，结合高质量音频数据提升性能，并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 577 浏览

语音助手

首页

语音助手

列表

默认

浏览次数

发布日期