语言支持

AiSofiya

Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强...

Motia

Motia 是一个面向软件工程师的 AI Agent 框架,支持多种编程语言并提供零基础设施部署能力。其模块化设计、多语言混合使用、内置可观测性和交互式开发环境,使得智能体的开发、测试和优化更加高效。适用于自动化工作流、复杂决策系统、数据处理及智能自动化等场景。

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。

Kotaemon

Kotaemon 是一款基于RAG技术的开源工具,支持用户通过自然语言与文档进行互动,从而实现高效的信息检索和理解。它支持多种语言模型,包括OpenAI、Azure OpenAI和Cohere等,提供简易的安装脚本。Kotaemon 还支持多用户协作、文档管理和复杂的推理方法,并允许用户自定义UI元素。其主要功能包括基于RAG技术的问答系统、多语言模型支持、文档管理、混合RAG管道、多模式问答支持

Yi

Yi-Coder是一款由零一万物开发的开源AI编程助手,支持52种主流编程语言,能够处理长达128K tokens的上下文。它在多个代码生成基准测试中表现优异,尤其在LiveCodeBench平台上的表现尤为突出。Yi-Coder在代码编辑和补全方面也有卓越的表现,适用于各种开发项目,帮助开发者提高工作效率。 ---

Video Dubbing

一款具有语音克隆和口型同步功能的AI视频翻译器,可以将视频中的语音转换成多种不同的语言,同时保持与原始视频的音频同步。

Wav2Lip

Wav2Lip是一款开源的唇形同步工具,能够将音频文件转换为与口型同步的视频。它支持多种语言,适用于视频编辑、游戏开发和虚拟现实等多个领域。Wav2Lip具备音频驱动口型生成、面部表情同步和多语言支持等功能,采用先进的技术原理,如数据预处理、音频特征提取、口型编码器、音频到口型映射及生成对抗网络(GAN)。该工具提升了电影和视频的后期制作质量,增强了虚拟现实中的交互体验,还用于游戏开发、语言学习和

FullStack Bench

FullStack Bench是一款由字节跳动与M-A-P社区联合推出的专业代码评估工具,主要针对全栈编程和多语言编程能力进行评估。它包含11种真实编程场景、3374个问题以及16种编程语言,具备全面评估、多语言支持、实际场景模拟、代码质量控制等特点,适用于代码智能评估、教育与培训、研究开发、软件测试及多语言编程能力评估等多个场景。

SadTalker

SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频,通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情,PoseVAE合成不同风格的头部运动,并采用3D面部渲染技术,实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力,适用于虚拟助手、视频制作、语言学习、社交媒体和教育等

飞跨浏览器

专为跨境电商卖家设计的浏览器,飞跨浏览器解决多账号管理、店铺安全、以及跨境操作中遇到的关联问题。