多模态

Pangea

Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型,支持39种语言,具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等,同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构,适用于多语言客户服务、教育、跨文化交流等多个领域。

智谱API

新用户免费领1亿tokens,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式。

Wordware

Wordware是一个强大的AI应用开发工具,它通过自然语言编程简化了AI代理的创建过程,提供了先进的技术能力和用户友好的界面。

VisionFM

VisionFM是一款专为眼科设计的多模态多任务视觉基础模型,通过大规模预训练支持多种眼科成像模态处理,涵盖疾病筛查、诊断、预后预测、表型细分及全身性生物标志物分析等功能。其在疾病诊断上的表现超越了大部分眼科医生,并具备强大的泛化能力和少样本学习能力。

BuboGPT

BuboGPT是一个创新的大型多模态语言模型,它通过结合视觉、音频和文本输入,提供了一种全新的交互体验。

华之科

基于openAi的大模型应用,提供支持多轮对话,内容创作、图片制作、音乐制作、图片文档表格等文件的内容解析的相关功能。

达尔文大模型

通过先进的数据处理和模型分析技术,为生物学研究和产业发展提供了强有力的支持。同时,其附带的数字人SaaS平台进一步扩展了AI技术在内容生产和品牌营销中的应用,使得达尔文大模...

ChatMusician

通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。