科研星球

临床资料统计分析一般流程梳理

1. 提出临床研究问题,根据现有条件进行试验设计,制定研究方案

在医学实践过程中提出问题,然后围绕提出的科学问题,设计试验,制订研究方案,统计分析人员应当从试验设计阶段就参与研究项目,而不是临床医生获得数据之后,才想到统计分析。医学研究一般有干预性研究、观察性研究、诊断准确性试验、预后研究四种。所谓干预性研究是人们通过设定严格的纳入标准、通过正确随机化、合理设置对照、保持两组均衡、设置盲法等措施来控制混杂因素。而观察性研究,不可能入为控制很多混杂因素,但可通过设计合理的样本选择方法、尽可能准确地收集有用的信息、选择多因素统计分析方法,从而进一步控制混杂因素,确保结果的准确性。

 

2. 根据研究方案收集数据,并把数据整理为可统计分析格式

研究方案制定后,需要严格按照研究方案执行,一般会制定相应的CRF(单个病例记录表)表收集数据,即便是使用Excel收集数据,也需要严格按照既定的研究方案执行,并将这些数据及时电子化,变成可统计分析的格式。

 

我们需要事先定义好结局指标与将要收集的变量。结局指标大体上可以分为计量资料和分类资料结局,计量资料指测定每个观察单位的某项指标量的大小,比如收缩压大小;而观察单位按照某种属性或类别则为分类资料结局,比如有效/无效。还有一类结局指标是生存资料,不但考虑结局是否发生,而且考虑从观察开始至结局发生的时间,这类生存资料在临床研究中亦常见。分清楚结局指标类型后,需要将资料分解成观测与变量。观测简单讲就是你纳入的一个研究对象就称作一个观测,变量是指具有相同属性的测量值的集合。观测与变量结合起来就能准确地描述二维空间的所有研究对象的所有特征,我们在统计分析时一般会把数据集整理为数据框格式,这种数据框中的每一行表示一个观测,每一列表示一个变量,如此集合就是一个完整的数据框结构的数据集。区分结局指标为计量资料还是分类资料,然后将资料整理为由观测与变量组合而成的数据框,这是统计分析的基础。

 

3. 在试验设计阶段需要确定能够回答该临床问题的可选统计方法,此条非常重要

根据研究目的设计试验方案,并且在试验方案中规定需要使用的主要统计方法,根据研究方案和统计分析的要求收集资料,这才是正确的研究步骤,很多研究者忽略了这一点,经常是收集好数据以后才想到去求助统计学家,往往为时晚矣。统计方法的选择,一般根据终点指标的类型确定。如计量资料结局可选用t 检验、方差分析、秩和检验和线性回归分析等,分类资料结局可选择卡方检验、秩和检验和Logistic回归分析等。不同的资料和研究目的有多种可供选择的统计方法; 而多种不同的统计方法可以对应多种资料类型,回答多种问题,如秩和检验能处理不符合方差分析条件的计量资料,也可以分析等级资料。有关统计方法的选择我们将单独作为一节讲解,因为它实在是太重要了。

 

4. 选用合适的统计软件,进行统计分析,报告统计结果

获得了数据框结构的数据集,把数据集导入统计软件,选对了统计方法,计算出结果并非难事。然而,事情并没有这么简单,统计分析是一个系统工程,需要进行预分析、正式分析等多次尝试,最终获得一个临床可解释的符合逻辑的结果。比如一份计量资料,我们首先考虑使用线性模型进行方差分析,但是分析过程中发现方差不齐,我们可以改做秩和检验。如在Logistic回归分析过程中,可以分别选用全部进入法和逐步回归法筛选变量,也可以先做单因素分析根据单因素分析的P值筛选变量,也可以几种方法均尝试一下,然后比较几种方法所得出结果的差异,再根据专业知识和分析目的,作出自己的判断。可见统计分析不是一蹴而就的过程,而是不断尝试、不断思考、不断调优的过程。

 

5. 评估统计结果,合理表达结果,结合专业知识与统计结果回答我们提出的临床问题

这里需要注意的是统计结果的表达载体无非是表格、图形与文字,选择的原则也是优先选择图形,其次是表格,再次是文字。选择合适的载体才能有效传达信息。此外,我们也要注意从统计结论过渡到专业结论,大家都需要特别慎重,不可过度推断,随意发挥,基于统计结果做出合理的推断,得到符合逻辑的结论,才是严谨而有价值的研究。统计分析流程读者可参考下图1.


640 (4).jpg

没有账号?