Huxe AI Huxe AI是一款基于生成式AI技术的个人音频伴侣应用,旨在为用户提供高度个性化的音频体验。其主要功能包括个性化音频简报、实时问答、减少屏幕时间以及与现有应用的无缝集成。通过连接用户的日历、邮件等数据流,Huxe AI能够生成定制化的语音内容,帮助用户高效管理日程、获取信息并提升学习效率。 AI项目与工具 2025年06月12日 76 点赞 0 评论 264 浏览
蜜小语 蜜小语是一款专注于提升聊天体验的移动应用,提供蜜语键盘、聊天标签和热度调节等功能,帮助用户在恋爱、职场、朋友聚会及网络社交中更自然流畅地交流。其标签库涵盖多种场景,并支持自定义设置,增强个性化表达。用户可通过订阅服务获取更多高级功能。 AI项目与工具 2025年06月12日 13 点赞 0 评论 112 浏览
MinMo MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型,具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互,适用于智能客服、教育、医疗等多个领域,提升人机对话的自然度与效率。 AI项目与工具 2025年06月12日 59 点赞 0 评论 484 浏览
Pipecat Pipecat是一款开源Python框架,用于构建语音和多模态对话系统。它整合了语音识别、文本转语音及对话处理功能,支持与主流AI平台集成,采用模块化管道架构,提升开发效率。基于帧的实时处理机制确保流畅交互,适用于语音助手、企业服务、教育、医疗及多模态应用等多种场景。 AI项目与工具 2025年06月12日 78 点赞 0 评论 351 浏览
Weebo Weebo是一款基于AI技术的实时语音交互工具,支持语音识别与生成,实现自然流畅的语音对话。具备多语言支持和实时响应能力,适用于个人助理、娱乐互动和教育辅导等场景。技术上融合了Whisper Small、Llama 3.2等模型,提供便捷高效的语音交互体验。 AI项目与工具 2025年06月12日 72 点赞 0 评论 240 浏览
T2A T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型,可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能,适用于有声读物、影视配音、教育、语言学习等多种场景,提供高质量、个性化的语音输出。 AI项目与工具 2025年06月12日 46 点赞 0 评论 146 浏览
百聆 百聆是一款开源语音对话系统,融合语音识别、语音活动检测、大语言模型和语音合成技术,实现自然流畅的语音交互。支持低延迟运行,无需GPU,适用于边缘设备。具备记忆、工具调用和任务管理等功能,适用于智能家居、个人助理、车载系统等多种场景,提供高效的语音交互解决方案。 AI项目与工具 2025年06月12日 90 点赞 0 评论 144 浏览
Boardy Boardy是一款基于AI与语音技术的人脉拓展工具,通过智能对话了解用户需求并提供精准推荐。支持双向确认连接,提升合作质量。内置数据可视化模块,用户可轻松创建自动更新的仪表板,适用于创业者、高管及企业用户,助力资源拓展与职业发展。 AI项目与工具 2025年06月12日 26 点赞 0 评论 205 浏览
WhisperKeyboard WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具,支持多语言实时语音转文字,适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能,兼容多平台,提升输入效率与文本质量。 AI项目与工具 2025年06月12日 76 点赞 0 评论 314 浏览
TIGER TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。 AI项目与工具 2025年06月12日 98 点赞 0 评论 462 浏览