面向高等教育领域的命名实体标注语料库构建方法OA
Construction Method of Named Entity Annotation Corpus for Higher Education Field
文章以高等教育政策文件为语料,在领域专家指导下结合高等教育政策文件文本特点,制定了一套标注体系和标注规范,开展了大规模的语料标注工作,构建了一个面向高等教育领域的标注语料库.该语料库共标注了137篇政策文件,包含5102个句子和3639个实体.同时,通过使用模型对语料库进行实验,探讨了语料库的可信度及预标注策略的可行性.结果表明,该语料库的F1值达到75.31%,为进一步的高等教育领域实体识别研究提供了基础.
黄柯源;张浩军;李世龙;李大岭;王家慧
河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001河南工业大学 信息科学与工程学院,河南 郑州 450001
信息技术与安全科学
高等教育命名实体标注规范语料库构建
《现代信息科技》 2022 (5)
95-97,3
国家第二批新工科研究与实践项目(E-CXCYYR20200937)国家自然科学基金面上项目(62073123)河南省科技攻关项目(212102210086)2020年河南省新工科研究与实践项目(2020JGLX037)
评论