基于时序数据降维的脓毒症死亡风险预测模型OACSTPCD
现有脓毒症患者死亡风险预测模型大多需要患者的血常规结果等数据,输入特征较多且采集化验流程复杂。针对这个问题,提出了改进的包裹式(Wrapper)特征筛选方法以及基于LSTM和XGBoost的SD2V-XGBoost预测模型,能够仅使用较少的临床实时体征预测脓毒症患者的死亡风险。首先,利用改进的包裹式特征筛选方法筛选出和患者死亡风险相关性高的特征;其次,使用LSTM网络将患者的时间序列数据映射成向量;最后,将LSTM网络输出的向量和患者体征的统计特征作为XGBoost的输入,预测患者的死亡风险。使用公开的MIMIC-III数据集进行实验。在输入特征数量方面,和已有研究的模型对比,SD2V-XGBoost模型在保持预测精度的前提下将输入特征数量减少了71%;在预测精度方面,仅使用临床实时体征,SD2V-XGBoost的接受者操作特征曲线下面积为0.852 1,准确召回率曲线下面积为0.632 0,死亡样本召回率为72.15%,均优于LSTM、XGBoost和随机森林模型。
朱亚强;袁学光;李丹丹;李元涛;黄小红;
北京邮电大学计算机学院,北京100876北京邮电大学电子工程学院,北京100876南方医科大学附属深圳妇幼保健院麻醉科,深圳518047
数学
长短时记忆网络死亡风险预测时序数据处理特征筛选XGBoost模型
《计算机与数字工程》 2024 (008)
P.2355-2360 / 6
校企科研型联合实验室项目(编号:B2019011)资助。
评论