结合噪声网络的强化学习远程监督关系抽取OA北大核心CSTPCD
针对目前远程监督关系抽取任务中存在的错误标注问题,提出使用强化学习策略设计噪声指示器,通过与由关系分类器和噪声数据组成的环境相交互,动态识别每个关系类别的假正例与假负例,并为其重新分配正确的关系标签,从而将噪声数据转换成有用的训练样本,有利于提高远程监督关系抽取模型的性能;另外,在训练过程中,通过在策略网络权重上添加噪声,平衡策略网络的探索和利用问题,从而增强噪声指示器的探索能力,使噪声指示器更准确地选择出能够正确表达实体-关系的句子。在Free…查看全部>>
谢斌红;王恩慧;张英俊
太原科技大学计算机科学与技术学院,太原030024太原科技大学计算机科学与技术学院,太原030024太原科技大学计算机科学与技术学院,太原030024
信息技术与安全科学
远程监督关系抽取强化学习噪声网络假负例
《计算机工程与应用》 2022 (23)
P.169-177,9
评论