文献解读：PAWNN评分预测新冠患者住院死亡风险_文献解读_SCI

今天给大家要分享是武汉大学研究人员在2021年1月7日Cell旗下子刊Med杂志上新发表的论文，作者利用机器学习算法筛选重要的血常规指标建立综合的风险评分模型（PAWNN）用于预测COVID-19住院病人的死亡风险，这将有助于优化临床决策，合理分配紧张的医疗资源。这篇文章对于临床医生的科研有极大地启发，本文数据来源于常规的血液检测指标，结合简单的机器学习算法开发出一种准确预测模型，是一篇比较经典的关于机器学习结合常规临床化验检测指标的论文，同时也值得每个人深入学习和挖掘，特此分享给大家，如有不足之处请批评指正。

0 (1).png

研究背景

2021年新型冠状病毒病（COVID-19）仍然在全球肆虐，无论是发展中国家还是发达国家都没有逃过新冠病毒的魔爪，COVID-19的预防和控制给医疗资源不足的国家卫生系统造成了重大压力。因此迫切需要开发一种准确、可靠的风险评估工具来评估疾病的预后，帮助一线临床医生优化医疗干预和有限的医疗资源。

为此作者收集并分析了大量COVID-19病例的全血计数（CBC）纵向数据，发现基于一些选定CBC参数的综合评分可以动态预测住院期间即将死亡的风险，具有较高的准确性。作者还揭示了CBC参数的纵向轨迹以及COVID-19在住院期间疾病严重程度的综合评分。其研究结果将特别有助于优化临床决策，并有可能降低那些正在遭受严重短缺医疗资源国家的死亡率。

数据与方法

总共为12911名COVID-19患者，从中排除152例白血病患者。利用剩余的12759名患者进行分析，其中9810名患者在住院期间至少进行了两次CBC测试被指定为训练集，进行了一次CBC测试被指定为验证集，最终通过广义线性混合模型（GLMM）进行选择风险因选择和建立模型。在住院期间的3个不同阶段至少进行3次CBC测试的3174名患者被纳入Latent Markov Model（LMM）的研究。此外还有227名来自意大利的队列拥有验证PAWNN评分的性能。

结果展示

1.湖北省住院病人临床特点分析

表1展示的是病人入院时的基线临床特征、既往慢性病和实验室检查。

0 (2).png

2.CBC参数的动态轨迹

图2显示的是患者从入院到住院第30天按疾病严重程度分组的13个CBC参数动态轨迹的线性拟合曲线。白细胞（WBC）计数、中性粒细胞计数、中性粒细胞百分率和中性粒细胞/淋巴细胞比率（NLR）均随病情加重而增高。

相反，淋巴细胞计数、淋巴细胞百分比、单核细胞计数、嗜酸性粒细胞计数、嗜碱性粒细胞计数和血小板计数的水平随着疾病的严重程度而降低。红细胞（RBC）计数、红细胞压积和血红蛋白浓度在入院时无显著差异。

0 (3).png

3.预测因子选择和评分开发

训练队列中的9810例患者被用于变量选择和风险评分制定。变量选择过程如图3，共有38个变量用于后续变量选择，包括25个分类变量和13个连续参数。以各变量为固定效应的广义线性混合效应模型（GLMMs）按Akaike信息准则（AIC）排序。

为了进一步选择最有效的固定效应预测因子，作者使用了正向逐步方法的多变量GLMMs选择出了4个血常规参数，最终还增加了控制年龄的类别，基于此利用Cox比例风险回归模型构成了由5个变量组成的风险评估评分模型（PAWNN评分）。每个因素具体的数值分数可见表2。

0 (5).png

0 (4).png

4.PAWNN评分在训练和验证队列中的性能

作者通过10折交叉验证对患者进行PAWNN评分的准确性和特异性的内部验证。受试者操作特征（AUROC）曲线下的面积范围为0.92（95%CI 0.91-0.93）到0.93（95%CI 0.92-0.94）。PAWNN评分的趋势图显示住院期间非严重幸存者、严重幸存者和死亡组的水平存在明显差异。通过将随访期划分为四分位数，我们发现PAWNN评分在不同时间间隔预测死亡率的准确性仍然很高。入院后0-1天的最低AUROC为0.89（95%CI 0.88-0.90），临界值为6分；入院后8天的最高AUROC为0.94（95%CI 0.93-0.94/0.95），临界值为6分（图S1C和表S3）。

在湖北省2949例住院期间仅进行一次CBC检测的验证数据集中，PAWNN评分的AUROC为0.97（95%CI 0.96-0.98），敏感性为93.84%（95%CI 90.51-98.10），特异性为90.90%（95%CI 85.13-92.84）（表3）。PAWNN评分的表现在来自意大利米兰的COVID-19患者队列中进行了进一步测试，这些患者在入院时收集了CBC数据。意大利队列的可预测性表现仍然很高，AUROC为0.80（95%CI，0.74-0.86），敏感性为68.83%（95%CI，58.44-94.81），特异性为80.67%（95%CI，49.33-87.33）（表3）。

5.潜在马尔可夫模型Latent Markov Model (LMM)

潜在马尔可夫模型由潜在疾病状态的结构模型和观测指标的测量模型组成，这两个模型是GLMM中选择的参数。图4显示了三种状态模型的结构以及每种状态的流行情况。转变轨迹显示出一个清晰的模式，即所有死亡结果患者要么经历中危到高危过程，要么直接从低危组转归，而少数中危患者转归到低危状态。从Time1的低风险状态到Time2的中风险和高风险状态的转移概率分别为18%和1%。从Time1中危组到Time2低危组的转移概率为27%。在Time2中17%的低危组患者和1%的中危组患者转移到Time3的高危组。

总的来说，在所有时间点高危组的PAWNN评分均显著高于存活组。PAWNN评分是所有三个时间点死亡的良好预测指标，AUROC在Time1为0.77，Time2为0.91，Time3为0.97。PAWNN评分对Time2潜伏期和Time3潜伏期的判别能力的AUROC分别为0.86和0.81。对于预测转移概率，从Time1的PAWNN评分到Time2的潜伏期AUROC值为0.86，从Time2的PAWNN评分到Time3的潜伏期AUROC值为0.81。

0 (7).png

研究结论

作者对共13138例COVID-19住院患者进行了回顾性队列研究，通过广义线性混合模型（GLMM）对全血计数（CBC）进行选择作为潜在预测因子，采用Cox比例风险回归模型从血小板计数、年龄、白细胞计数、中性粒细胞计数和中性粒细胞/淋巴细胞比率五个危险因素中得出综合评分（PAWNN评分）。PAWNN评分在10折交叉验证（AUROCs 0.92-0.93）和不同四分位随访间隔和既往疾病的亚组中显示出很好的预测死亡率的准确性。在2949例患者（AUROC 0.97）和意大利组227例患者（AUROC 0.80）中进一步验证了该评分的有效性。

隐马尔可夫模型（LMM）产生了可识别的患者状态，其中PAWNN评分是一个显著特征。PAWNN评分对不同潜在条件之间的转移概率有很好的预测能力。PAWNN评分是一个简单而准确的风险评估工具，可以预测COVID-19患者在整个住院期间的死亡率风险。这一工具可以帮助临床医生优先考虑COVID-19住院患者的治疗，特别是在资源有限的欠发达地区。

参考文献：

Liu, H., Chen, J.， Development and Validation of a Risk Score Using Complete Blood Count to Predict In-hospital Mortality in COVID-19 Patients, Med (2021), doi: https://doi.org/10.1016/j.medj.2020.12.013.

科研星球

文献解读：PAWNN评分预测新冠患者住院死亡风险

标签