Molmo 72B是由艾伦人工智能研究所(AI2)开发的一款开源多模态AI模型,专注于处理图像和文本数据的融合与理解。该模型基于Qwen2-72B构建,并采用OpenAI的CLIP作为视觉编码器。Molmo 72B在多项学术基准测试中表现出色,超越了包括Llama 3.2 90B在内的众多竞争者。其核心功能涵盖图像描述生成、视觉问答、文档解析及多模态交互等,同时具备与用户界面元素交互的能力。Molmo 72B的发布进一步推动了开源AI领域的进步,为研究者和开发者提供了强有力的工具支持。
Molmo 72B是由艾伦人工智能研究所(AI2)开发的一款开源多模态AI模型,专注于处理图像和文本数据的融合与理解。该模型基于Qwen2-72B构建,并采用OpenAI的CLIP作为视觉编码器。Molmo 72B在多项学术基准测试中表现出色,超越了包括Llama 3.2 90B在内的众多竞争者。其核心功能涵盖图像描述生成、视觉问答、文档解析及多模态交互等,同时具备与用户界面元素交互的能力。Molmo 72B的发布进一步推动了开源AI领域的进步,为研究者和开发者提供了强有力的工具支持。
发表评论 取消回复