首页|期刊导航|电子学报|面向机器学习模型安全的测试与修复

面向机器学习模型安全的测试与修复OA北大核心CSTPCD

The Testing and Repairing Methods for Machine Learning Model Security

中文摘要

近年来,以机器学习算法为代表的人工智能技术在计算机视觉、自然语言处理、语音识别等领域取得了广泛的应用,各式各样的机器学习模型为人们的生活带来了巨大的便利.机器学习模型的工作流程可以分为三个阶段.首先,模型接收人工收集或算法生成的原始数据作为输入,并通过预处理算法(如数据增强和特征提取)对数据进行预处理.随后,模型定义神经元或层的架构,并通过运算符(例如卷积和池)构建计算图.最后,模型调用机器学习框架的函数功能实现计算图并执行计算,根据模型神经元的权重计算输入数据的预测结果.在这个过程中,模型中单个神经元输出的轻微波动可能会导致完全不同的模型输出,从而带来巨大的安全风险.然而,由于对机器学习模型的固有脆弱性及其黑箱特征行为的理解不足,研究人员很难提前识别或定位这些潜在的安全风险,这为个人生命财产安全乃至国家安全带来了诸多风险和隐患.研究机器学习模型安全的相关测试与修复方法,对深刻理解模型内部风险与脆弱性、全面保障机器学习系统安全性以及促进人工智能技术的广泛应用有着重要意义.本文从不同安全测试属性出发,详细介绍了现有的机器学习模型安全测试和修复技术,总结和分析了现有研究中的不足,探讨针对机器学习模型安全的测试与修复的技术进展和未来挑战,为模型的安全应用提供了指导和参考.本文首先介绍了机器学习模型的结构组成和主要安全测试属性,随后从机器学习模型的三个组成部分即数据、算法和实现,六种模型安全相关测试属性即正确性、鲁棒性、公平性、效率、可解释性和隐私性,分析、归纳和总结了相关的测试与修复方法及技术,并探讨了现有方法的局限.最后本文讨论和展望了机器学习模型安全的测试与修复方法的主要技术挑战和发展趋势.

张笑宇;沈超;蔺琛皓;李前;王骞;李琦;管晓宏

西安交通大学电子与信息学部网络空间安全学院,陕西西安 710049智能网络与网络安全教育部重点实验室(西安交通大学),陕西西安 710049西安交通大学电子与信息学部网络空间安全学院,陕西西安 710049智能网络与网络安全教育部重点实验室(西安交通大学),陕西西安 710049西安交通大学电子与信息学部网络空间安全学院,陕西西安 710049智能网络与网络安全教育部重点实验室(西安交通大学),陕西西安 710049西安交通大学电子与信息学部网络空间安全学院,陕西西安 710049

信息技术与安全科学

人工智能安全机器学习安全机器学习模型测试机器学习模型修复软件测试软件修复

《电子学报》 2022 (12)

针对深度学习模型的攻防分析基础理论与关键技术

2884-2918,35

科技创新2030——"新一代人工智能"重大项目(No.2020AAA0107702)国家自然科学基金(No.62161160337,No.U21B2018,No.U20A20177,No.62132011,No.62006181,No.U20B2049)陕西重点研发计划项目(No.2021ZD LGY01-02)

10.12263/DZXB.20220821

评论