支持

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型,通过有限标量量化技术和新型架构设计,在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理,延迟低至150ms,广泛应用于智能助手、有声读物、视频配音及语言学习等领域,同时具备多语言支持和情感控制等功能。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

AImReply

AImReply 是一款可帮助您在几秒钟内制作专业、个性化且引人入胜的电子邮件回复的在线 AI 工具。

PAPERCUP

利用人工智能配音,让现有视频内容更快、更经济地走向全球。

Ztalk ai

一个AI驱动的会议实时语音翻译平台,可以与 Zoom、Google Meet 等视频会议平台集成。提供超30种语言的即时语音到语音翻译,延迟小于 100 毫秒,具备高级音频处理和企业安全功能。

NovaMSS

NovaMSS是一款基于AI技术的音乐源分离工具,可精准分离人声、伴奏、贝斯、鼓点等音轨。支持多种音频格式和批量处理,操作简便,适用于音乐制作、音频修复及教学资源开发等多种场景。提供普通与专业模型,满足不同用户的音质需求,适合创作者和音乐爱好者使用。

Uncrop | 图片自动补全

UNCROP是一款在线AI图片自动补全工具。它利用强大的AI人工智能技术,能够帮助我们对图片进行扩展和自动补全,兼容上下、左右方向的扩充。

小冰

小冰是一套完整的人工智能交互主体基础框架,也称为小冰框架(Avatar Framework)。它包括核心对话引擎、多重交互感官、第三方内容的触发与第一方内容生成,以及跨平台的部署解决...

Insighto.ai

Insighto.ai是一个基于人工智能的通信平台,支持多语言对话、24/7客户支持及跨渠道互动。其核心功能包括语音和文本交互、个性化客户体验、CRM集成以及无代码构建能力,广泛应用于客户服务、销售、预约管理等领域,助力企业提升运营效率和客户满意度。

CodeName Goose

一款开源代码智能体Agent,Codename Goose不仅能自动生成代码,还能安装、执行、测试。