MMBench

简介：MMBench-Video是一个由多家高校和机构联合开发的长视频多题问答基准测试平台，旨在全面评估大型视觉语言模型（LVLMs）在视频理解方面的能力。平台包含约600个YouTube视频片段，覆盖16个类别，并配备高质量的人工标注问答对。通过自动化评估机制，MMBench-Video能够有效提升评估的精度和效率，为模型优化和学术研究提供重要支持。

AI小编 658 阅读 0 评论 52 点赞

项目地址

MMBench-Video是由浙江大学、上海人工智能实验室、上海交通大学和香港中文大学联合研发的新型长视频多题问答基准测试平台。该平台专注于评估大型视觉语言模型（LVLMs）在视频理解领域的综合能力，通过引入包含丰富内容和细粒度能力评估的长视频，有效弥补了现有基准测试在时序理解和复杂任务处理方面的局限性。MMBench-Video涵盖了来自YouTube的约600个视频片段，涉及16个主要类别，每个片段时长介于30秒至6分钟之间，并附有由志愿者精心编写的高质量问答对。为了确保评估的准确性和一致性，该基准测试采用GPT-4进行自动化评估。MMBench-Video的推出为研究人员提供了强有力的工具，用于评估和改进视频语言模型的性能。

本文分类：AI项目与工具
本文标签：视频理解大型视觉语言模型长视频评估自动化评估细粒度能力评估视频语言模型时序推理模型优化学术研究智能视频分析
浏览次数：658 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10567.html

上一篇 > 15个AI视频翻译工具和软件，自动配音生成全球任意语言
下一篇 > novelcrafter

评论列表共有 0 条评论

暂无评论

MMBench

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复