融合标签信息的裁判文书证据抽取方法研究OACSTPCD

Research on Judgment Document Evidence Extraction Method Combined with Label Information

中文摘要

针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法.首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引.实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93％.

作者：周裕林;鹿安琪;周雯童;刘林红

作者单位：公共大数据国家重点实验室贵阳 550025贵州大学计算机科学与技术学院贵阳 550025贵州大学计算机科学与技术学院贵阳 550025贵州大学计算机科学与技术学院贵阳 550025

分类：信息技术与安全科学

中文关键词：标签信息裁判文书机器阅读理解证据抽取

刊名：《计算机与数字工程》 2022 (9)

页码/页数：2025-2029,5

基金：贵州大学大学生创新创业训练计划项目(编号:贵大(省)创字2021(055))资助.

DOI：10.3969/j.issn.1672-9722.2022.09.027

您当前未登录！

去登录

点击加载更多...

融合标签信息的裁判文书证据抽取方法研究OACSTPCD

Research on Judgment Document Evidence Extraction Method Combined with Label Information

评论