多语言

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言;CosyVoice则专注于自然语音生成,支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景,其相关模型和代码已公开发布。

AiSofiya

Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强...

SLEA.AI

SLEA.AI是一款利用人工智能技术的免费Logo生成工具,支持用户通过简单输入品牌信息快速生成多款定制化Logo。该工具具备友好的操作界面、强大的编辑功能以及高分辨率无水印下载选项,适用于初创企业、电商店铺、非营利组织及个人创作者等多个领域,帮助用户实现高效的品牌形象构建。

Dubbing Studio

一个全自动化的AI配音或视频翻译工具,你只需要上传视频或者粘贴视频链接,AI Dubbing就能全自动的在几十秒到几分钟内将你的视频翻译成29种语言。

pipio

pipio是一款专业的视频AI配音工具,集成了高精度的口型匹配技术、多语言翻译能力和高质量的声音克隆功能。它支持超过40种语言,能够快速实现视频内容的本地化,适用于国际营销、教育培训、娱乐传媒等多个领域,显著提高了跨语言视频制作的效率。

WowTo

WowTo提供了一个全面的平台,使用户能够轻松创建、定制和集成视频知识库。无论是创建教学视频、支持视频还是逐步视频,WowTo都能帮助提高客户满意度并提供全天候的视频支持。

Open Deep Research

Open Deep Research 是一个开源 AI 智能体,支持多语言模型和 Firecrawl 数据提取,用于执行复杂的研究任务。它提供统一 API 和 Next.js 框架,具备实时数据处理、结构化信息提取及多维度分析能力,适用于文献综述、行业分析、投资研究等场景。

Chatsimple Ai

一个AI聊天机器人平台,允许企业在其网站上部署定制的ChatGPT AI聊天机器人。该平台提供简单的集成,无需编码,使企业能够与访客互动,提升客户体验。

Videotoword.ai

Videotoword.ai 是一款以AI驱动的在线服务,支持将音频和视频文件转化为文本,具有高精度(99.9%)和多语言支持(98种以上)。它能处理长达10小时的文件,具备自动转录、文本编辑导出及AI摘要生成功能,广泛应用于教育、媒体、法律和企业等领域。