低资源场景下苹果种植领域实体关系联合抽取模型OA北大核心CSTPCD
由于苹果种植领域实体关系联合抽取任务标注成本高昂以及与专业领域的强相关性,提高模型在低资源场景中的抽取性能至关重要。针对这一问题,该研究提出了一种基于强化学习的实体关系联合抽取模型。模型包含实体识别模块和基于强化学习的关系抽取模块。引入强化学习的训练架构,通过关系生成器生成伪标签,训练一个策略网络以最大化伪标签数据与有标签数据在梯度方向上的相似性,同时鼓励模型在伪标签数据上进行优化,提高模型对未标注数据的泛化能力。为了验证该研究模型的效果,将其与主流的低资源场景下关系抽取模型在苹果种植领域语料库进行了对比,结果表明在标注数据占比达到30%时,该研究模型的F1值达到了88.71%,相对其余基线有较大提升,与MetaSRE相比提高了2.8个百分点。此外,在公开数据集TACRED上,该模型在低资源场景下也能对实体关系进行有效抽取,F1值达到了59.93%。该模型通过梯度模拟算法的奖励反馈机制得到可泛化的显式信号,相较于直接采用标记数据训练模型得到的隐式信号更具有指导意义,且不会导致逐步漂移问题,实现了低资源场景下实体关系的快速抽取,为苹果种植领域知识图谱高效快速构建提供了解决办法。
张宇;李书琴;
西北农林科技大学信息工程学院,杨凌712100
计算机与自动化
苹果联合抽取实体识别关系抽取强化学习
《农业工程学报》 2024 (016)
P.188-195 / 8
高端外国专家引进计划(G20200027087)。
评论