VSI-Bench(Visual-Spatial Intelligence Benchmark)是由李飞飞、谢赛宁及其研究团队开发的一种视觉空间智能基准测试工具。该工具旨在评估多模态大型语言模型(MLLMs)在空间认知和理解方面的能力。VSI-Bench包含超过5000个问题-答案对,涵盖近290个真实室内场景视频,涉及住宅、办公室和工厂等多种环境。任务类型包括配置型任务(如物体计数、相对距离)、测量估计(如物体尺寸、房间大小)以及时空任务(如物体出现顺序),能够系统地检验和提升MLLMs在视觉空间智能领域的表现。 ---
发表评论 取消回复