多语言

豆包向量化API

Doubao-embedding是字节跳动推出的语义向量化API,支持中英文文本处理及长文本向量化,提供多种维度的向量输出和丰富的SDK支持,适用于搜索引擎、推荐系统、知识图谱构建和自然语言处理等多种应用场景。

AstrBot

AstrBot是一款多功能聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字、网页搜索等功能。它采用模块化设计,支持插件开发和多平台部署,适用于企业客服、个人助手、教育辅导等多个场景,提供高效的智能交互体验。

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集,包含1000亿个图像与文本配对数据,是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建,保留了丰富的语言和文化多样性,支持多模态任务如图像分类、图像描述生成和视觉问答,广泛应用于人工智能研究、工程开发及教育领域。

GenFM

GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。

Chatgpt4o.ai

一个提供免费访问GPT-4o模型的平台,用户可以提出各种问题并获得答案。

dots.llm1

dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts(MoE)文本大模型,拥有 1420 亿参数,激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练,采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术,提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型,通过有限标量量化技术和新型架构设计,在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理,延迟低至150ms,广泛应用于智能助手、有声读物、视频配音及语言学习等领域,同时具备多语言支持和情感控制等功能。

Notehot.ai

Notehot.ai 是一款基于 AI 技术的智能写作与编辑平台,支持自动写作、内容优化、语法校正、语气调整、一键总结及多语言翻译等功能。它能够帮助用户快速生成高质量文本,优化语言表达,并适应不同应用场景的需求,广泛适用于教育、医疗、金融等行业。

VAPI

VAPI是一个面向开发者的语音AI平台,凭借其简便的API集成、高精度语音识别、多语言支持以及定制化能力,能够协助开发者快速将语音技术嵌入至不同类型的软件应用中。它注重数据隐私与安全性,并提供多样化的应用场景,如智能助手、客户服务自动化、教育培训、医疗健康及呼叫中心等,帮助企业提升运营效率和服务质量。

MyVocal.AI

一种快速简便的方法,用于克隆您的声音,以进行唱歌或演讲。MyVocal.AI提供声音克隆,文本转语音和文本转歌曲的功能。