科研星球

临床研究基线均衡性比较除了用P值大小来反映,还可以用这种方法!

均衡性原则是指除了处理因素不同外,其他对观察结果有影响的因素应尽量一致 。


组间基线资料的均衡性是为了保证反应变量观察结果的组间可比 性,以便在相似的基线条件下考察处理因素对观察结 果的真实影响。目前基线资料均衡性的检验方法常用的是假设检验。


根据P值判断是否均衡其实不那么可靠!

假设检验的目的是通过样本对总体进行推断,而基线均衡性比较的目的是比较样本间的可比性,因此前者的意义在总体层面,后者的意义则在样本层面上。另外根据假设检验和样本量的关系可知,即使样本实 际的均衡性没有变化,随着样本量的减少,检验效能降低,也会得出较大的 P 值,即均衡性变好的假相,所以通过假设检验得出的基线“均衡”是不可靠的。此时,如果预先对基线数据进行组间比较,作者可能会选择性不报告组间差异有统计学意义的变量,而导致选择性报告偏倚。


因此在随机对照试验中,很多基线比较,干脆不需要提供假设检验和P值的结果。因为这是多余,P值是否小于0.05都不能很好说明是否均衡。


怎么办?我推荐标准化差异法 ( standardized difference ) 


而标准化差异法不再注重P值,而注重实际差别。标准化差异的定义由 Flury 和 Reidwyl 在 1986 年 首次提出。


对于连续性变量,其算法是:

0.png

可以看出,标准化差值,其实根据两组数据的均数和标准差,将差值转为类似于z值的d值。


对于分类变量,它的算法是

0 (1).png


一般地,当标准化差异小于 0.1 时,认为组 间该变量的均衡性较好 。这一点可见于大部分的文献,有心的朋友今后可以留意一下。


总结来说,

假设检验P值,在小样本时,对不均衡性不敏感;对大样本又过于铭感。标准化差异 正是在小样本情况下也可以检验出基线资料不均衡性的方法。标准化差异同时适用于连续型变量和分类变 量的均衡性比较,且不受度量衡的影响。标准化差异 的优点还在于可以量化指标差异的大小,也可以结合示意图直观地表示。


标准化差异不仅可以用于一般组间差异性比较,还可以特别可用于倾向评分的差异性比较和基于加权的倾向评分比较,不会受到样本量,特别是加权之后样本量的变动影响。


案例分析

比如2019年最新出版的研究慢性肾病的大队列研究中,就是用了标准化率的方法。该研究基于逆概率加权的方法进行匹配研究。

0 (2).png

这是匹配前的基线数据,很多标准化差值都超过10%

0 (3).png


这是匹配后的基线数据,标准化差值都小于10%

0 (4).png


没有账号?