精准的疾病诊断是临床工作中必不可少的重要环节,诊断性研究就是在不断地组合、比较和优化不同的诊断试验,从而更好地服务临床。
熟练掌握诊断试验知识不仅可以优化医疗资源配置,亦可为诊断相关研究设计提供保障与新思路,在数据处理方面也更加游刃有余。
大量的诊断性研究数据往往让人束手无策,这就需要我们掌握相关基本概念,以及串/并联试验的研究设计,严谨、翔实的数据分析和新颖、高效的诊断组合都会为研究或文章增色不少。
今天,笔者就相关内容做一些分享。
首先,明确几个概念,大家看下面这张图:
图源:NEJM 期刊 OA 文章(PMID:30157391)
这样的图想必大家都见过很多了,在生信研究、预测模型研究和临床研究中都很常见。
这类图就是 ROC 曲线(Receiver Operating Characteristic Curve,接收者操作特征),提取出其中的关键词就是 AUC、sensitivity 和 specificity 等。
ROC 曲线背后的核心是一个混淆矩阵:
其中:
1)真阳性(TP):诊断为有,实际上也有。
2)伪阳性(FP):诊断为有,实际却没有,一类错误(接受了错误的)。
3)真阴性(TN):诊断为没有,实际上也没有。
4)伪阴性(FN):诊断为没有,实际却有,二类错误(拒绝了正确的)。
5)真阳性率(TPR):又称灵敏度 (sensitivity),TPR = TP / P = TP / (TP+FN)
6)伪阳性率(FPR):FPR = FP / N = FP / (FP + TN)
7)真阴性率(TNR):又称特异度(specificity),TNR = TN / N = TN / (FP + TN) = 1 - FPR
8)准确度(ACC):ACC = (TP + TN) / (P + N)
9)曲线下面积(AUC):AUC 取值在 0~1 范围,可以简单地认为,AUC 值越大的诊断方法越好。
厘清这些概念后不难发现,一个完美的诊断方法应同时具备高特异度和高灵敏度。
完美的分类标准可以达到 100% 的灵敏度(所有患者都会被检测为阳性),及 100% 的特异度(没有一个健康人会被检测为生病)。
但是理论上所有的分类算法/标准都会有最小的误差范围,称为贝叶斯错误率。
一个诊断方法的诊断标准变动时,如果提高灵敏度,必然会付出降低特异度的代价,反之亦然。
在临床实践中总是在平衡灵敏度和特意度,那么,有没有方法可以在现有基础上提高灵敏度/特异度呢?
答案是肯定的,可以利用多项诊断试验来检查同一受试者的方式来实现,这种方式称为联合试验,可进一步分为串联试验、并联试验和混合试验。
串联试验
在临床工作中进行诊断试验时,往往会优先使用安全无创、快速易操作且费用较低的检查手段,在初筛出阳性患者后再进一步使用灵敏度和特异度更高的检查,而这些检查往往也更为复杂、昂贵,一部分检查为安全性较低的有创检查。
最典型的例子就是在糖尿病的诊断过程中,先采用尿糖测试筛选出一部分阳性患者,进一步检测血糖耐量,两项指标均阳性得以最终确诊。
这种串联的联合试验可以提高特异度、减少误诊率,但增加了漏诊率(降低了灵敏度)。
当临床诊断时间充裕时,误诊会造成严重后果时,目前的检查手段特异度不够高时,或必须进行昂贵、有创的检查时,可用串联试验(序列试验)提高特异度。
串联法,先在第一阶段使用特异度较高的方法缩减进入第二阶段试验的人数,同时节约了成本。接下来在第二阶段安排较为昂贵、不易操作或安全性较差的有创检查。
第一阶段检查为阴性的患者,则不必进入第二阶段。
而对于罕见病、危重病或对治疗敏感的疾病则可以在第一阶段使用灵敏度较高的检查手段以提高检出率,第二阶段再使用特异度高的检查。
两个试验结果彼此独立时,串联试验联合灵敏度/特异度计算如下:
净灵敏度 = 试验 1 灵敏度 × 试验 2 灵敏度
净特异度 = 试验 1 特异度 +(1 - 试验 1 特异度)× 试验 2 特异度
并联试验
并联试验(平行试验)则是指在诊断过程时,多个指标中有一个阳性即可诊断为阳性。
这种方法提高了灵敏度,但在一定程度上降低了特异度,主要用于减少漏诊率。
例如静脉造影是不少血管性疾病的诊断「金标准」,但造影为有创检查,且昂贵、耗时。此时,可以考虑加用其他便于操作、安全性较高但灵敏度稍差的方法进行联合诊断。乳房触诊与乳腺 X 线联合诊断乳腺癌也是类似的道理。
两个试验结果彼此独立时,并联试验联合灵敏度/特异度计算如下:
净灵敏度 = 试验 1 灵敏度 +(1 - 试验 1 灵敏度)× 试验 2 灵敏度
净特异度 = 试验 1 特异度 × 试验 2 特异度
联合试验
与电路设计类似,联合试验同时包括串联与并联试验。
最常见的就是在复杂疾病的诊治指南中出现的若干项主要指标和(或)其他次要指标联合诊断的模式;或是将若干指标合并,以达到减少指标条目和便于分析等目的。
最后,对串/并联试验的搭配模式加以概括:
串联试验漏诊率高,误诊率低;并联试验误诊率高,漏诊率低,两种混合试验就可以帮助医生更好的做诊断!
小 结
本文对诊断试验及 ROC 曲线相关内容进行了简要阐述。
ROC 可以将不同诊断方法的比较结果进行可视化,各种指标的性能高下立判,而对混淆矩阵的理解有助于 ROC 曲线的识读。
联合试验则通过将现有指标组合的方式对诊断过程加以优化,从而提高灵敏度或特异度,对不同类型的疾病采取不同的临床诊断决策有助于合理分配医疗资源、提高医疗效率。
文中关于联合试验灵敏度/特异度计算公式需以指标彼此独立为前提,但实际上同一种诊断目的的多种方法彼此独立的可能性较小,大家也可以通过将数据整理为混淆矩阵中四格表的方式进行计算。
作者:HL,文章来源丁香园