在线医疗文本中的实体识别研究OA北大核心CSCDCSTPCD
Entity Recognition Research in Online Medical Texts
针对在线医疗文本,设计考虑医疗领域特性的识别特征,并在自建数据集上进行实体识别实验.针对常见的5类疾病:胃炎、肺癌、哮喘、高血压和糖尿病,采用近年来较先进的机器学习模型条件随机场,进行训练和测试,抽取目标实体包括疾病、症状、药品、治疗方法和检查5类.通过采用逐一添加特征的实验方式,验证所提特征的有效性,取得总体上81.26%的准确率和60.18%的召回率,随后对识别特征给出进一步分析.
苏娅;刘杰;黄亚楼
南开大学计算机与控制工程学院(软件学院),天津300071南开大学计算机与控制工程学院(软件学院),天津300071南开大学计算机与控制工程学院(软件学院),天津300071
信息技术与安全科学
实体识别数据挖掘条件随机场医疗信息
named entity recognitiondata miningconditional random fieldmedical information
《北京大学学报(自然科学版)》 2016 (1)
1-9,9
天津市科技支撑项目(13ZCZDGX01098)、天津市自然科学基金(14JCQNJC00600)和中国民航信息技术科研基地开放课题(CAAC-ITRB-201303)资助
评论