|国家科技期刊平台
首页|期刊导航|计算机与现代化|基于BERT的电子病历命名实体识别

基于BERT的电子病历命名实体识别OACSTPCD

中文摘要

电子病历是保存、管理、传输病人医疗记录的重要资源,是医生诊治疾病的重要文本记录。通过电子病历命名实体识别(NER)技术能够高效、智能地从电子病历中抽取症状、疾病、药名等诊疗信息,有利于结构化电子病历,使之能够使用机器学习等技术进行诊疗规律挖掘。为了高效识别电子病历中的命名实体,提出一种融合对抗训练(FGM)的基于BERT与双向长短期记忆网络(BILSTM)的命名实体识别方法(BERT-BILSTM-CRF-FGM,BBCF),对2017全国知识图谱与语义计算大会(CCKS2017)提供的中文电子病历语料做修正等预处理后,采用BBCF模型识别该语料中5种实体的平均F1值为92.84%,比基于膨胀卷积网络的BERT模型(BERT-IDCNN-CRF)和基于BILSTM的条件随机场模型(BILSTM-CRF)有更高的F1值和更快的收敛速度,能够更加高效地结构化电子病历文本。

郑立瑞;肖晓霞;邹北骥;刘彬;周展;

湖南中医药大学信息科学与工程学院,湖南长沙410208湖南中医药大学信息科学与工程学院,湖南长沙410208 中南大学计算机学院,湖南长沙410083

计算机与自动化

电子病历命名实体识别BERTFGM双向长短期记忆网络条件随机场

《计算机与现代化》 2024 (001)

P.87-91 / 5

2017年科技部十三五重点研发计划(2017YFC1703300);科技创新2030-“新一代人工智能”重大项目课题(2018AAA0102102)。

10.3969/j.issn.1006-2475.2024.01.014

评论