VSI

简介：VSI-Bench是一种用于评估多模态大型语言模型（MLLMs）视觉空间智能的基准测试工具，包含超过5000个问题-答案对，覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务，可全面评估模型的空间认知、理解和记忆能力，并提供标准化的测试集用于模型性能对比。 ---

AI小编 667 阅读 0 评论 10 点赞

项目地址

VSI-Bench（Visual-Spatial Intelligence Benchmark）是由李飞飞、谢赛宁及其研究团队开发的一种视觉空间智能基准测试工具。该工具旨在评估多模态大型语言模型（MLLMs）在空间认知和理解方面的能力。VSI-Bench包含超过5000个问题-答案对，涵盖近290个真实室内场景视频，涉及住宅、办公室和工厂等多种环境。任务类型包括配置型任务（如物体计数、相对距离）、测量估计（如物体尺寸、房间大小）以及时空任务（如物体出现顺序），能够系统地检验和提升MLLMs在视觉空间智能领域的表现。 ---

本文分类：AI项目与工具
本文标签：视觉空间智能多模态大型语言模型空间认知基准测试配置型任务测量估计时空任务视频理解数据质量控制模型评估
浏览次数：667 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/9795.html

评论列表共有 0 条评论

暂无评论

VSI

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复