VE-Bench是由北京大学MMCAL研究团队开发的首个专注于视频编辑质量评估的指标。其设计目标在于高度契合人类感知能力,从而更精准地衡量视频编辑效果。VE-Bench QA不仅涵盖了传统视频质量评估中注重的视觉质量要素,如审美与失真,还特别关注文本与视频的对齐程度,以及源视频与编辑后视频间的动态关联性。 VE-Bench由两大部分组成:VE-Bench DB和VE-Bench QA。VE-Bench DB是一个全面的视频质量评估数据库,包含多种类型的源视频、编辑指令、不同编辑模型生成的结果及24位参与者主观评分,总计28,080个评分样本。VE-Bench QA则是一款量化且与人类感知一致的度量工具,专为文本驱动型视频编辑任务设计。其代码与数据资源可通过GitHub获取。
发表评论 取消回复