科研星球

定量资料的统计分析常见问题

1、不满足正态性要求

【原文】8例患者经插管化疗及栓塞后,阴道流血等症状消失,3周后复查血hCG值明显下降(见表1),治疗前后血hCG值经统计学处理有显著性差异(P<0.05)。


0.jpg


【分析】

在该研究中,作者意识到了原始数据不满足正态分布的条件,因此进行了对数转换,作者在注释1的描述“取其对数使之成为正态分布,经t检验P<0.05”,存在一点歧义,“t检验P<0.05”应该是针对组间差异的比较,但可能会让人以为是正态性检验的P<0.05。


该资料为同一组研究对象在治疗前后的测定值,属于自身前后对照设计,因此表1为配对资料,应该对差值(lgX1-lgX2)进行正态性检验。利用原文提供的数据进行正态性检验后发现,转换后依然不满足正态分布,因此不能选择配对t检验,而应该选择Wilcoxon符号秩和检验,结果为Z=-2.521,P=0.012,表明灌注治疗后,血hCG显著低于治疗前。


2、不满足方差齐性要求

【原文】平均年龄71岁与60岁以下患者药物动力学参数比较,见表2(只选取原文中前两个指标)。


0.png


【分析】

1. 该研究中,作者采用了成组t检验对“老年组”和“60岁以下组”的研究指标进行了比较。但是根据表2提供的数据,可以发现60岁以下组中,α指标的标准差大于均值,很有可能不满足正态分布的要求,但是由于缺乏原始数据,无法进一步进行检验。


2. 两组的α指标和β指标的标准差存在差异,尤其是α指标,“60岁以下组”的标准差明显大于“老年组”,因此需要进行方差齐性检验(H0:两组总体方差相等,H1=两组总体方差不相等)。经过计算发现:


α指标: 

F=3.5553/0.1177=912.43,P<0.10


β指标: 

F=0.10052/0.05492=3.35,P>0.10


因此α指标并不满足方差齐性的要求,不能使用成组t检验,考虑到两组样本含量较小,可以选择t’检验,计算t’值,对自由度进行校正,然后确定P值。



3、资料类型与统计分析方法不匹配

【原文】统计学处理:使用SPSS13.0统计软件对数据进行统计分析,其中计量资料采用图片表示,并且数据采用t检验,两组间差异采用χ2检验,当P<0.05时,数据对比有统计学意义(见表3)。


0 (1).jpg


【分析】

统计分析前需要正确识别资料的类型,然后再根据不同的资料类型选择正确的统计分析方法。统计资料一般分为定量资料和定性资料。


表3数据中,“住院时间”为定量资料,“感染率”、“患者满意度”、“并发症发生率”为定性资料。但是四个指标同时进行了t检验和χ2检验,可见作者并没有根据资料类型选择合适的统计分析方法。


“住院时间”为定量资料,在满足正态性的前提下,应该选择两独立样本t检验进行分析,而不能进行χ2检验分析(由于缺少原始数据,故这里无法验证结果)。


根据四格表的应用条件,“感染率”采用校正四格表χ2检验,χ= 0.669,= 0.413;“患者满意度”采用校正四格表χ2检验,χ= 1.350,= 0.245;“并发症发生率”采用四格表χ2检验,χ= 4.000,= 0.046。结果显示,计算结果与表3均并不相符,并且两组只有“并发症发生率”存在差异。


如果作者想对“住院时间”进行χ2检验,则需要对原始数据进行转换。例如该类疾病患者平均住院时间为x天,据此将患者分为“住院时间>x天”和“住院时间≤x天”两种情况,整理成如表4的形式,然后根据四格表χ2检验的应用条件进行计算。但是究竟是否需要对资料进行转换,还取决于资料的特点和作者的研究目的,而不能任意进行转换。


0 (1).png



4、忽略基线的影响

【原文】治疗前,观察组和对照组 CRP、TNF-α、IL-6比较无统计学差异(> 0.05);观察组治疗后与治疗前比较,CRP、TNF-α、IL-6显著下降,差异均有统计学意义(< 0.05);对照组治疗后与治疗前比较,CRP、TNF-α、IL-6显著下降,差异均有统计学意义(< 0.05);治疗后,观察组的CRP、TNF-α、IL-6分别为(11.13 ± 2.88) ng/L、(110.46 ± 29.66) ng/L、(44.04 ± 5.86) ng/L,均低于对照组,差异有统计学意义(< 0.05)。见表5。


0 (2).jpg


【分析】

该研究中,对照组接受常规治疗+阿托伐他汀钙胶囊,观察组接受常规治疗+阿托伐他汀钙胶囊+盐酸曲美他嗪片,要得到“阿托伐他汀联合曲美他嗪可更为显著的改善冠心病患者心功能,降低氧化应激损伤及炎症反应”的结论,仅仅依靠对治疗后两组进行两独立样本t检验的结果是不够的。该结果只能反映治疗后两组的研究指标存在差异,不能反映两种治疗方法疗效上的差异,因为这种做法忽略了基线值的影响。


对于这类的研究,正确的方法应该分别计算两组治疗前后差值的均值及其标准差Sd,若服从正态分布且总体方差相等,则可对两组的进行两独立样本t检验,以确定两组是否存在统计学差异。或者,考虑基线的影响,进行协方差分析。



5、误用t检验分析多分组资料

【原文】1. 对照组:按10ml/kg鼠重灌服生理盐水作为对照;2.莪术组:按10ml/kg鼠重分别灌服25%,50%或100%莪术水煎剂。对照组或莪术组统计子宫肌电爆发波的峰面积、持续时间和个数。全部数据均以均数±标准差表示,应用配对t检验进行统计学处理,P<0.05具有显著性意义。


0 (4).jpg


【分析】

表6为包含4个组的定量资料,作者选择使用配对t检验进行统计分析是错误的。配对t检验适用于配对设计的资料类型,例如相同研究对象治疗前后的比较,统计分析的目的是了解相同研究对象的研究指标在治疗前后是否存在差异。该研究是将大鼠分配到不同的组中,不同组接受不同的处理方式,统计分析的目的是为了证明不同组之间是否存在差异,因此并不适合使用配对t检验。


由于该研究涉及到了4组,为了解不同组之间是否存在差异,在满足正态性和方差齐性的前提下,应该进行方差分析。若结果为P<0.05,则表明4个组的总体均数不全相等,可以通过Dunnett-t检验,进一步对某些组别间进行两两比较;若数据不满足正态性/方差齐性的要求,则可以采用其他的方法,如秩和检验。



6、误用t检验分析重复测量资料

【原文】两组病人患肢肿胀减轻,治疗组在第3天,第7天,第14天的小腿周静的变化值大于对照组(P<0.05),患肢肿胀减轻的程度明显优于对照组。


0 (3).jpg


【分析】

该研究在分析时采用两独立样本t检验的方法,分别对第3天,第7天,第14天两组的情况进行比较分析。这种方法只能分别说明第3天,第7天,第14天的情况,并没有考虑到时间因素的影响。实际上表7属于重复测量资料,数据彼此间不是相互独立的,因此并不能选择两独立样本t检验。而是应该选择重复测量资料的方差分析方法,如果在不同时点上的测量值存在差异,可以进一步作两两比较。




没有账号?