首页|期刊导航|现代信息科技|面向高等教育领域的命名实体标注语料库构建方法

面向高等教育领域的命名实体标注语料库构建方法OA

Construction Method of Named Entity Annotation Corpus for Higher Education Field

中文摘要

文章以高等教育政策文件为语料,在领域专家指导下结合高等教育政策文件文本特点,制定了一套标注体系和标注规范,开展了大规模的语料标注工作,构建了一个面向高等教育领域的标注语料库.该语料库共标注了137篇政策文件,包含5102个句子和3639个实体.同时,通过使用模型对语料库进行实验,探讨了语料库的可信度及预标注策略的可行性.结果表明,该语料库的F1值达到75.31%,为进一步的高等教育领域实体识别研究提供了基础.

黄柯源;张浩军;李世龙;李大岭;王家慧

河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001

信息技术与安全科学

高等教育命名实体标注规范语料库构建

《现代信息科技》 2022 (5)

95-97,3

国家第二批新工科研究与实践项目(E-CXCYYR20200937)国家自然科学基金面上项目(62073123)河南省科技攻关项目(212102210086)2020年河南省新工科研究与实践项目(2020JGLX037)

10.19850/j.cnki.2096-4706.2022.05.025

评论

您当前未登录!去登录点击加载更多...