科研星球

国自然标书中如何正确描述所用的统计学方法

本文不是说什么国自然技巧的,就是想说一下标书中你想用的统计学方法如何进行描述。很多人在标书中可能都不太重视统计学方法的描述,我看到很多标书大致都随便写写,比如“计量资料采用t检验,计数资料采用卡方检验”之类的。当然,也可能不是不重视,只是确实不知道该怎么写,所以本文专门针对这一问题说一下。


不过在写之前,需要先申明一下,本文介绍的各种描述方法更像是八股文,对于统计学家来说可能会觉得死板,但对于非统计专业人员来说,我觉得还是有用的。毕竟,对于不熟悉某一领域的人而言,一开始如果能真有个八股文告诉你怎么写,已经足够了。


好了,废话不多说,直接切入主题。


如果你的标书内容是要做随机对照试验,做两组组间比较,可以参考以下写法(注意是参考,不是照抄):


对于连续资料,首先进行正态性检验,如果各组均满足正态性且两组间方差相等,采用t检验进行组间比较;否则考虑非参数Wilcoxon秩和检验。对于分类资料,无序结局采用卡方检验,有序资料采用非参数Wilcoxon秩和检验。


多组间比较


如果你的标书是做多组间比较,可以参考以下写法:


连续资料如果服从正态分布,采用方差分析进行组间比较,如果组间差异有统计学意义,进一步采用Bonferroni法(也可以是其它方法)进行两两比较。如果不服从正态分布,组间比较采用Kruskal-Wallis秩和检验,当组间总的有统计学差异,进一步采用DSCF法(也可以是其它方法)进行多重比较。分类资料根据其无序或有序的性质,采用χ2检验或Kruskal-Wallis秩和检验。


危险因素比较


如果你的标书是做危险因素筛选,采用回归分析,可以参考以下写法:


由于本研究中调查的危险因素较多,首先采用单因素线性回归(或logistics回归,视研究结局是连续资料还是分类资料而定)进行危险因素的初筛,为避免因素的遗漏,单因素分析设定alpha=0.15(根据实际情况,也可以设为0.1或0.2等),将单因素分析中P<0.15的因素纳入多因素线性回归(或logistics回归)。多因素分析以P<0.05认为有统计学意义。


诊断试验


如果你的标书是做诊断试验,且金标准是二分类资料,诊断指标是连续资料,可以参考以下写法:


本研究以***为金标准,绘制ROC曲线,并计算ROC曲线下面积,如果ROC曲线下面积大于0.5且与0.5相比有统计学差异,认为该诊断指标具有一定的诊断价值。根据ROC曲线,以最靠近左上角的点作为cut-off值,探索最佳截断点。


如果你的标书是做诊断试验,且金标准是二分类资料,诊断指标也是二分类资料,可以参考以下写法:


本研究以***为金标准,计算新的诊断方法的灵敏度、特异度、阳性预测值和阴性预测值等指标。计算二者的Kappa一致性系数,并进行统计学检验,如果P<0.05,认为二者的一致性具有统计学意义。Kappa一致性系数越高,说明二者的一致性越强。


组间比较


如果你的标书是组间比较,但是重复测量,可以参考以下写法:


本研究由于进行多次重复测量,因此考虑采用重复测量方差分析进行比较比较。分别比较组间、时间点之间是否有统计学差异,并对组间和时间点的交互项分析,探索各组间的变化趋势是否有差异。如果交互项有统计学意义,提示各组随时间变化的趋势可能不同。


生存分析


如果你的标书是做生存分析,可以参考以下写法:


本研究采用Kaplan-meier曲线描述生存变化情况,并采用log-rank检验或Wilcoxon检验比较生存曲线的差异。多因素分析,如果满足等比例风险假定,采用Cox回归,分析校正其它混杂因素后,研究因素对生存的影响。如果等比例风险假定不满足,则考虑采用非等比例Cox回归分析研究因素的影响。


样本量相关


关于样本量,可以参考以下写法:


① 组间比较:


根据以往文献,获得两组的均值和标准差分别为7.2(1.6)和6.4(1.1),设定一类错误概率α为0.05,把握度1-β为0.8,两组例数比例设为1:1。根据上述参数,利用SAS9.4的proc power过程(也可直接列出公式,利用公式,或用其它软件),计算试验组和对照组各需样本数为62例。


② 诊断试验:


根据以往文献,获得该指标的灵敏度(或特异度、ROC曲线下面积)为0.8,根据以往文献报道的95%置信区间宽度,设定研究精度为0.1。根据上述参数,利用公式,计算所需病例数为62例。由于患病与非患病之比为0.6:0.4,因此共需样本数为104例。


总结


本文只是简单说了一下常见的一些统计方法如何体现在标书中,写的不是很全面,但可以作为参考。其实,除了上面说的内容外,还有一些共性的东西,比如,缺失值的处理,很多研究中都有缺失值,如何处理一般也需要体现在计划书中,如直接删掉、采用统计方法进行填补等等。


再如,异常值的处理,如果发现异常值怎么办,直接删掉?还是采用统计方法进行处理,比如采用稳健的回归方法等。


我曾经看过很多标书的统计学方法部分都写得有点随意,虽然本文也不是尽善尽美,但起码有一定提示作用,希望本文能够对各位正在申请标书的同仁有一定帮助。


没有账号?