基于XLNET模型的开阳磷矿成矿条件相关地质实体识别与应用OA北大核心CSTPCD
随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立了磷矿成矿地质实体自动识别的方法。首先对实体进行BIO标注建立地质实体字典,利用XLNET作为底层预处理模型学习句子双向语义;然后使用BILSTM-Attention-CRF模型实现文本多标签的智能分类;最后通过定位磷矿实体在报告中的分布位置大致推测该处磷矿成矿条件和成矿模式。将该模型与其余3种模型比较得出结果,该模型识别的准确率(P)、召回率(R)及F1值都接近了90%,较前3种模型分别调高了2%,5%,6%。该研究为开阳磷矿地质研究人员提供了更加高效的地质实体自动识别的方法。
彭彬;田宜平;曾斌;吴雪超;吴文明;
中国地质大学(武汉)计算机学院,武汉430078中国地质大学(武汉)计算机学院,武汉430078 中国地质大学(武汉)生物地质与环境地质国家重点实验室,武汉430078 中国地质大学(武汉)智能地学信息处理湖北省重点实验室,武汉430078 自然资源部基岩区矿产资源勘查工程技术创新中心,贵阳550081 贵州省战略矿产智慧勘查重点实验室,贵阳550081中国地质大学(武汉)计算机学院,武汉430078 贵州省战略矿产智慧勘查重点实验室,贵阳550081 武汉地大坤迪科技有限公司,武汉430200自然资源部基岩区矿产资源勘查工程技术创新中心,贵阳550081 贵州省战略矿产智慧勘查重点实验室,贵阳550081 贵州省地质矿产勘查开发局一○五地质大队,贵阳550018
地质学
地质实体识别XLNET-BILSTM-Attention-CRF磷矿成矿模式预训练模型序列标注
《地质科技通报》 2024 (004)
P.224-234 / 11
中央引导地方科技发展资金项目“锰矿资源深部预测勘查技术研发基地”(黔科中引地[2021]4027);“贵州磷、锰、铝优势资源成矿规律与快速高效智慧化勘查技术研究及示范项目”(黔科合战略找矿[2022]ZD003、[2022]ZD004);智能地学信息处理湖北省重点实验室2022年度开放研究课题(KLIGIP-2022-B05);2021年度生物地质与环境地质国家重点实验室自主课题(128-GKZ21Y647)。
评论