医疗

MonkeyOCR

MonkeyOCR是由华中科技大学与金山办公联合开发的文档解析模型,能够高效地将非结构化文档内容转换为结构化信息。其支持多种文档类型和语言,处理复杂文档(如公式、表格)效果显著,处理速度达每秒0.84页。基于SRR三元组范式和MonkeyDoc数据集,模型在准确性和效率上表现优异,适用于自动化业务流程、数字存档、智能教育、医疗记录管理及学术研究等场景。

MindLLM

MindLLM是由多所高校联合开发的AI模型,可将功能性磁共振成像(fMRI)信号解码为自然语言文本。其采用主体无关的fMRI编码器与大型语言模型结合,并引入脑指令调优技术,实现跨个体的高精度解码。该模型在多项任务中表现优异,具备广泛的应用潜力,包括医疗康复、脑机接口、神经科学研究及人机交互等领域。

Hedy AI

Hedy AI 是一款提升会议与对话效率的AI工具,支持19种语言,提供实时转录、智能总结、个性化提示及上下文敏感的见解。适用于商务会议、面试、课堂及医疗预约等场景,帮助用户更好地理解信息、提出有效问题并提升参与度。支持跨设备使用,注重隐私保护,适合多语言环境下的高效沟通。

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。

Google Beam

Google Beam是谷歌推出的AI驱动的3D视频通信平台,能够将2D视频流转换为逼真的3D效果,提升远程通话的自然度和直观性。用户可实现眼神交流和细微表情识别,增强沟通效果。支持实时语音翻译,打破语言障碍,并基于Google Cloud提供企业级可靠性,适用于远程协作、教育、医疗、国际合作和个人社交等多种场景。

MedGemma

MedGemma是谷歌推出的开源AI模型,专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告,27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署,适用于医疗诊断、患者分诊、临床决策辅助等场景,提升医疗服务效率与准确性。

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型,具备结构化推理和透明性,支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试,涵盖4000多个推理步骤,用于全面评估推理能力。其性能优于多个开源模型,适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景,具有高准确性和可解释性。

Yescribe.ai

一款AI驱动的转录服务,Yescribe.ai能够将音频和视频文件准确快速地转换为文本。支持98种语言、多种格式,并确保各行业的安全转录。

汉王天地大模型

汉王天地大模型是一个综合性的AI语言助手,它通过提供丰富的语言处理功能,帮助用户在多种场景下提高效率和创造力。

智谱CoCo

智谱CoCo是智谱AICO平台推出的首个企业级超级助手Agent,具备交付导向、记忆机制和无缝嵌入三大特性。它能全流程辅助工作,根据员工职能和需求主动服务,无缝接入企业资源,提供个性化服务。支持多种对话方式,包括快思考、慢思考和页面唤起,适用于政务、企业、个人助理、教育与培训、金融与医疗等多个场景,提升工作效率和用户体验。