医疗

Aria

Aria是首个开源多模态原生混合专家(MoE)模型,支持文本、代码、图像和视频的综合处理,具有强大的多模态任务处理能力和长上下文窗口,可高效应对复杂长数据。模型开源且可扩展,适用于多模态AI领域的研究与应用。

SPAR

SPAR是一种自我博弈框架,专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动,利用树搜索技术和迭代优化,提升模型的自我完善能力。实验显示,SPAR在多个基准测试中表现出色,适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

Avaturn

Avaturn是一款基于AI的3D虚拟形象生成平台,支持用户通过上传照片生成逼真的3D头像和全身模型。它提供丰富的定制选项,如面部特征、发型、肤色、服装和配饰,并具备实时预览功能。Avaturn适用于社交媒体、在线游戏、虚拟会议、电子商务、教育培训及健康医疗等领域,旨在推动虚拟互动和数字身份的发展。

AllGPTs

AllGPTs是一个集中展示可在 ChatGPT 中使用的各种GPTs代理(GPT Agents)的目录。这个目录每天都会更新为用户提供最新的GPT工具信息。

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型,专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步,并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度,在多个视觉推理基准测试中表现出色。

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。

启元重症大模型

启元重症大模型是一款面向ICU环境的医疗人工智能系统,依托于腾讯的混元大模型架构,集成了庞大的医学知识库和先进的自然语言处理技术,能够快速生成病历、总结病情、提供诊疗建议等,大幅提升了重症医疗的服务质量和工作效率。其核心技术包括医学知识图谱构建、数据处理与分析、模型压缩优化以及临床逻辑推理能力,适用于多种应用场景如ICU监护、智能辅助诊疗、病历自动化生成等。

汉王天地大模型

汉王天地大模型是一个综合性的AI语言助手,它通过提供丰富的语言处理功能,帮助用户在多种场景下提高效率和创造力。

硅语AI

硅基智能开发的AI数字人及视频翻译技术,支持用您自己的语调、口型同步和说话风格免费进行视频语言翻译,创建能够与人类进行互动的虚拟人物。

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型,能够处理音频、图像、视频和文本等多种输入,并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色,具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练,结合高质量音频数据提升性能,并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。