语言支持 - 智狐AI导航

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型，通过有限标量量化技术和新型架构设计，在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理，延迟低至150ms，广泛应用于智能助手、有声读物、视频配音及语言学习等领域，同时具备多语言支持和情感控制等功能。

AI项目与工具 2025年06月12日 10 点赞 0 评论 592 浏览

品食PicEats

一款专为海外旅行者设计的 AI 美食工具，品食PicEats集成了菜单拍照翻译、菜品识别、当地美食推荐与餐厅点评等功能。

生活创意 2025年06月05日 30 点赞 0 评论 592 浏览

OpenAudio S1是Fish Audio推出的文本转语音（TTS）模型，基于200万小时音频数据训练，支持13种语言。采用双自回归架构和RLHF技术，生成自然流畅的语音，支持50多种情感和语调标记。具备零样本和少样本语音克隆功能，仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版，满足

AI项目与工具 2025年06月11日 28 点赞 0 评论 592 浏览

Speechki

Speechki 是一款高效文本转语音工具，支持多语言和多种语音选择，具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高，适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成，提升文本转音频的效率和实用性。

AI项目与工具 2025年06月12日 50 点赞 0 评论 590 浏览

VAPI

VAPI是一个面向开发者的语音AI平台，凭借其简便的API集成、高精度语音识别、多语言支持以及定制化能力，能够协助开发者快速将语音技术嵌入至不同类型的软件应用中。它注重数据隐私与安全性，并提供多样化的应用场景，如智能助手、客户服务自动化、教育培训、医疗健康及呼叫中心等，帮助企业提升运营效率和服务质量。

AI项目与工具 2025年06月12日 91 点赞 0 评论 586 浏览