基于空洞单流ViT网络的灵活模态人脸呈现攻击检测方法OA北大核心CSTPCD
灵活模态人脸呈现攻击检测突破传统多模态方法对于模型训练与部署的模态一致性限制,可将统一模型按需灵活部署到多样模态的现实场景,但仍存在模型性能有待提升、计算资源需求高的问题。为此,提出一种以视觉Transformer(ViT)结构为基础的单流灵活模态人脸呈现攻击检测网络。提出空洞块嵌入模块以减少运算冗余,降低输入向量维度;为区分不同模态特征,设计模态编码标记;采用非补齐策略处理模态缺失问题。在公开多模态数据集上的实验结果表明,该方法在域内和跨域评估中分别获得2.69%和33.81%的最佳平均ACER值,相较于现有的三种方法,具有更优的域内和域外泛化性能,在不同子协议上的性能表现较为均衡,且其模型计算量与参数量均远低于多流方法,更加适合模态缺失场景下的灵活、高效部署。
肖立轩;封筠;高宇豪;贺晶晶;
石家庄铁道大学信息科学与技术学院,石家庄050043
计算机与自动化
人脸呈现攻击检测灵活模态多模态视觉Transformer
《计算机应用研究》 2024 (003)
P.916-922 / 7
国家自然科学基金资助项目(61772070,61972267);河北省高等学校科学技术研究重点项目(ZD2021333)。
评论