面向采购文件的跨模态图片文本命名实体识别OA北大核心CSTPCD
智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Vector-Bi-LSTM-CRF),从图片文本中识别命名实体。该模型针对光学字符识别技术识别出的图片文本字符,定义连续文本字符边界,将边界内每个文本字符映射为向量,设计双向长短期记忆(Bi-LSTM)网络捕获边界内字符序列的上下文语义,计算字符状态分数矩阵,并通过条件随机场约束字符标记序列规则,获得全局最优标记序列。针对训练集计算命名实体预测误差,动态优化O2V2BLC模型的参数,实现命名实体识别。将该方法应用于采购文件资质类型等图片文本数据,能够有效识别图片中的投标单位、专家姓名、专业名称等命名实体,与条件随机场、隐马尔可夫算法、Bert-Bi-LSTM-CRF模型进行对比,显著提高了实体识别准确率,为智慧供应链的数智化采购提供支持。
杨赛;刘昕;于绍文;
鑫方盛数智科技股份有限公司,北京102600 爱丁堡大学商学院,英国爱丁堡EH89JS中国石油大学(华东)计算机科学与技术学院,山东青岛266580
计算机与自动化
智慧供应链命名实体识别光学字符识别双向长短期记忆网络条件随机场
《计算机工程与应用》 2024 (003)
P.213-219 / 7
山东省基金面上项目(ZR2020MF04);国家社科基金(20BTJ060)。
评论