VideoPhy是由加州大学洛杉矶分校(UCLA)与谷歌研究院共同研发的基准测试工具,专注于评估视频生成模型的物理常识能力。该工具通过对比生成视频与实际物理规律的一致性,揭示了当前模型在模拟物理世界方面的局限性。VideoPhy包含688条经人类验证的描述性字幕,涵盖固体-固体、固体-流体以及流体-流体间的物理互动,并支持自动评估工具VideoCon-Physics的集成。此外,VideoPhy还提供了人类评估与自动评估相结合的方法,用于量化视频生成模型的表现。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部