网络威胁技战术情报识别提取生成式技术研究OA北大核心
MITREATT&CK定义了网络攻击全过程14类战术625类技术,逐步成为网络威胁技战术情报(TTP)的事实标准,现有研究基于此分类将TTP识别提取问题转化为句子级别的战、技术类别多分类任务,利用深度学习、基于提示工程的大语言模型进行问题研究。但限于数据集小样本类别占比大、多分类模型性能瓶颈问题,类别识别覆盖率与精度较低。提出结合ChatGPT数据增强和指令监督微调大语言模型的方法,较好地解决了句子级别技术类别多分类问题。ChatGPT数据增强方法在保留原始样本语义基础上更好地丰富了样本多样性,为小样本学习高性能识别提供了高质量训练数据支撑,实验结果也证明了本数据增强方法的优越性;指令监督微调大语言模型,突破了深度学习多分类模型的性能瓶颈,实现625类技术类别识别全覆盖,Precision、Recall和F1值分别达到了86.2%、89.9%和88.0%,优于已有研究。
于丰瑞;杜彦辉
中国人民公安大学信息网络安全学院,北京100038 内蒙古警察职业学院,呼和浩特010051中国人民公安大学信息网络安全学院,北京100038
计算机与自动化
网络威胁情报(CTI)网络威胁技战术情报(TTP)ATT&CK数据增强大语言模型监督微调(SFT)
《计算机科学与探索》 2025 (1)
P.118-131,14
中国人民公安大学网络空间安全执法技术双一流创新研究专项(2023SYL07)内蒙古警察职业学院重点科研项目(NMJY2022-LX-ZD007)。
评论