语音交互 - 智狐AI导航

KHOJ

KHOJ是一款开源的AI助手，支持多源知识整合与语义搜索，兼容多种文档格式和AI模型。提供图像生成、语音交互、跨平台访问等功能，支持本地与云端部署，适用于个人知识管理、学习研究、团队协作等场景，具有高度灵活性和可扩展性。

AI项目与工具 2025年06月12日 24 点赞 0 评论 904 浏览

Martin

Martin是一款由大学生团队开发的人工智能助手，支持语音交互与多平台通信，具备日程管理、邮件处理、任务跟踪、文件管理等功能。它通过自定义记忆架构理解用户偏好，提供个性化服务，适用于日常办公和生活管理，提升工作效率与便利性。

AI项目与工具 2025年06月12日 25 点赞 0 评论 900 浏览

Quick Mock

Quick Mock 是一款由 MirWork AI 开发的 AI 驱动型面试准备工具，能够将职位描述转化为定制化模拟面试体验。用户可通过 Chrome 扩展程序与 AI 面试官进行实时语音对话，并获得详细的反馈和评分。该工具支持与 LinkedIn 等平台集成，简化了面试练习流程，适用于求职者、企业培训及教学辅助等多种场景，有效提升沟通能力和面试表现。

AI项目与工具 2025年06月12日 52 点赞 0 评论 892 浏览

Voiceflow

Voiceflow 是一款面向非技术用户的无代码对话式 AI 平台，具备直观的拖放界面和强大的自然语言处理能力。它支持复杂对话流程的设计、多渠道部署及团队协作，适用于客户服务自动化、虚拟助手开发、语音交互系统构建等多个领域，为企业和个人提供灵活且高效的解决方案。

AI项目与工具 2025年06月12日 21 点赞 0 评论 875 浏览

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型，通过集成自动语音识别（ASR）、大型语言模型（LLM）、文本到语音（TTS）以及WebSockets等技术，提供高质量、实时的语音交互体验。它支持全双工交互和打断功能，可整合网络搜索和RAG模型以增强回答能力，适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 857 浏览

Unmute

Unmute 是 Kyutai 推出的低延迟语音交互系统，专注于语音转文字和文字转语音功能。基于先进 AI 模型，提供实时、高效的语音交互体验，支持用户与 AI 进行语音交流，并能将文字内容快速转换为自然流畅的语音输出。其低延迟处理能力实现无缝交互，具备快速集成、随时打断、10秒生成声音、多样化调整等功能，适用于在线教育、智能客服、语音助手、游戏娱乐和企业会议等场景。

AI项目与工具 2025年06月11日 58 点赞 0 评论 851 浏览

Copilot Vision

Copilot Vision是一款由微软开发的人工智能辅助工具，专为Microsoft Edge浏览器设计，处于预览阶段。它能够理解网页内容，通过语音交互为用户提供实时分析和见解，帮助用户进行活动规划、购物决策和学习辅助，同时确保用户隐私安全。

AI项目与工具 2025年06月12日 79 点赞 0 评论 834 浏览

App Intents

App Intents 是苹果推出的全新框架，支持开发者将 Siri 和 Apple Intelligence 集成到 iOS 和 macOS 应用中，实现语音控制、自动化操作及内容搜索等功能，大幅提升应用的智能化和便捷性。其核心技术包括意图定义、参数解析和对话管理，适用于邮件、智能家居、笔记、日程管理和健康追踪等多种场景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 832 浏览

Mochii AI

Mochii AI 是一款多功能AI助手，支持智能对话、文档分析、网页总结、图像识别等功能，兼容多种AI模型。用户可跨平台使用，适用于文档处理、内容创作、代码生成及数据分析等场景，具备个性化定制和上下文理解能力，提升工作效率与体验。

AI项目与工具 2025年06月12日 80 点赞 0 评论 818 浏览

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型，支持图像与语音的自然交互。它基于Moshi 7B架构，集成了视觉编码器和跨注意力机制，实现低延迟、自然流畅的对话体验。支持多种后端部署，适用于无障碍应用、智能家居、教育及工业场景，提升人机交互的智能化水平。

AI项目与工具 2025年06月12日 72 点赞 0 评论 806 浏览

语音交互

首页

语音交互

列表

默认

浏览次数

发布日期