FakeShield是由北京大学的研究团队推出的一款多模态大型语言模型框架,专注于图像伪造检测及定位。该框架能够综合评估图像的真实性,并生成被篡改区域的掩码,同时提供基于像素级和图像级篡改线索的判断依据。为了提升模型性能,研究团队利用GPT-4o增强现有数据集,构建了多模态篡改描述数据集(MMTDSet),用于训练模型的篡改分析能力。FakeShield的核心由两大模块组成:领域标签引导的可解释伪造检测模块(DTE-FDM)和多模态伪造定位模块(MFLM)。这两个模块分别负责检测和定位伪造图像中的篡改区域。FakeShield在应对多种篡改技术(如Photoshop、DeepFake和AIGC编辑等)时表现出色,提供了比传统方法更精准且更具可解释性的解决方案。
发表评论 取消回复