多语言

Ztalk ai

一个AI驱动的会议实时语音翻译平台,可以与 Zoom、Google Meet 等视频会议平台集成。提供超30种语言的即时语音到语音翻译,延迟小于 100 毫秒,具备高级音频处理和企业安全功能。

Pitchgrade

PitchGrade是一款基于人工智能的演示生成器,帮助用户以超过180种语言创建高质量和富有研究性的演示文稿。

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具,通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言,适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景,为内容创作者提供高效且多样化的语音解决方案。

Talkstack

TalkStack是一款基于AI代理的企业级工具,提供全天候客户服务与销售支持。它支持多语言处理、全渠道通信和自动化工作流,能够显著提升客户互动效率和销售业绩,广泛应用于客户服务、销售、日程安排及市场调研等多个领域。

Maya

Maya是一款开源多语言多模态模型,基于LLaVA框架开发,支持中文、法语、西班牙语等多种语言,专注于提升低资源语言的AI内容生成能力。它结合图像和文本数据,实现跨模态对齐和指令微调,广泛应用于跨语言内容理解、图像分析、教育和电子商务等领域。

风车Ai翻译

高效的外贸跨境电商翻译工具,支持中英日韩欧美东南亚等多国语言,便捷的图片、短视频精修工具,支持API调用,轻松打造精品出海内容素材。

Tarsier

字节跳动推出的一系列大规模视觉语言模型(LVLM),专注于视频理解任务,包括视频描述、问答、视频定位、幻觉测试等功能。

TurboScribe

TurboScribe是一款利用AI技术实现高效音频和视频转录的服务平台,支持98种以上语言的文本转换,具备强大的文件处理能力和多格式兼容性。通过加密技术保障数据安全,提供多样化的成绩单导出选项,并支持说话人识别功能,广泛应用于播客制作、会议记录、学术研究等领域。

通义灵码

通义灵码,你的智能编码助手,为开发者提供行级和函数级代码续写、单元测试生成、代码注释生成、研发智能问答等能力,助你高质高效地完成编码工作。

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型,支持多语言、多模态处理,具备文本、图像及短视频分析能力。提供多种模型尺寸,适配不同硬件环境,优化了单 GPU/TPU 性能,推理速度提升显著。内置图像安全分类器,增强内容安全性。支持多种开发工具和部署方式,适用于人脸识别、物体检测、智能助手、文本分析等场景。