信息网络安全 ›› 2025, Vol. 25 ›› Issue (9): 1456-1464.doi: 10.3969/j.issn.1671-1122.2025.09.013

• 入选论文 • 上一篇    下一篇

多尺度多层次特征融合的深度伪造人脸检测方法

陈咏豪, 蔡满春(), 张溢文, 彭舒凡, 姚利峰, 朱懿   

  1. 中国人民公安大学信息网络安全学院,北京 100038
  • 收稿日期:2024-12-09 出版日期:2025-09-10 发布日期:2025-09-18
  • 通讯作者: 蔡满春 caimanchun@ppsuc.edu.cn
  • 作者简介:陈咏豪(2000—),男,广东,硕士研究生, CCF会员,主要研究方向为网络安全、人工智能|蔡满春(1972—),男,河北,副教授,博士,主要研究方向为网络与通信保密、人工智能安全|张溢文(2000—),男,安徽,硕士研究生,主要研究方向为人工智能、网络安全|彭舒凡(1998—),男,江苏,博士研究生,主要研究方向为信息网络安全|姚利峰(1998—),男,山西,硕士研究生,主要研究方向为深度学习、流量分析和入侵检测|朱懿(2000—),男,上海,硕士研究生,主要研究方向为深度学习、流量分析
  • 基金资助:
    国家重点研发计划(2018YFC23205);中国人民公安大学2022年度基本科研业务费项目(2022JKF02009)

A Multi-Scale and Multi-Level Feature Fusion Approach for Deepfake Face Detection

CHEN Yonghao, CAI Manchun(), ZHANG Yiwen, PENG Shufan, YAO Lifeng, ZHU Yi   

  1. College of Information and Cyber Security, People’s Public Security University of China, Beijing 100038, China
  • Received:2024-12-09 Online:2025-09-10 Published:2025-09-18

摘要:

随着深度伪造技术的发展,现有伪造人脸特征呈现多尺度特点,且伪造特征会在不同层级特征中保留。然而,现有检测方案普遍未能充分利用这些特征。针对该问题,文章提出一种基于多尺度多层次特征融合的深度伪造人脸检测方法。首先,在滑动窗口变压器(Swin Transformer)中引入重叠窗口注意力单元,用于提取多尺度伪造特征;然后,设计了一种创新性的多尺度特征融合模块,该模块能够对不同层次提取的多尺度特征进行融合,从而获得表达能力更强、鲁棒性更优的多层次特征表示;最后,在FaceForensics++(FF++)和Celeb-DF(V2)数据集上验证了所提方法的有效性。

关键词: 深度伪造检测, 多尺度特征融合, 深度学习, 空间域

Abstract:

With the advancement of deepfake technology, current forged facial features exhibit multi-scale characteristics, and forgery artifacts persist across feature hierarchies. However, existing detection approaches generally fail to fully leverage these features. To address this issue, the paper proposed a deepfake detection method based on multi-scale and multi-level feature fusion. First, an overlapping window attention unit was integrated into Swin Transformer to extract multi-scale forgery features. Next, an innovative multi-scale feature fusion module was designed, which can fuse features of different scales extracted from various levels, thereby obtaining more expressive and robust multi-level feature representations. Finally, the effectiveness of the proposed method was validated on the FaceForensics++ (FF++) and Celeb-DF(V2) datasets.

Key words: deepfake detection, multi-scale feature fusion, deep learning, spatial domain

中图分类号: