论文中撰写统计分析方法的注意事项_统计与绘图_实用技巧

在撰写论文时，有临床医生可能会不清楚统计分析部分应该写到什么程度。国际生物医学期刊的编辑委员会建议，统计分析方法的描述，应能保证具备相关知识并且能够获得原始数据的读者重复结果。针对论文中的统计分析方法撰写，小咖整理了来自医咖会合作伙伴石瑀博士的一场讲座《临床研究方案中统计分析部分的撰写》，希望能给大家一些启发。

先举几个例子

下图是经常看到的中文研究计划书和中文期刊中对统计分析部分的描述。基本都是一些套话，例如用哪一种统计软件，计量资料数据以均数±标准差表示，计数资料以百分率表示，p<0.05为差异有统计学意义。以上的描述都是不符合发表规范的。

NEJM的论文举例

0 (1).png

0 (2).png

上图是NEJM的案例，在统计分析部分，除了样本量估算的段落外，还有补充附件（Supplementary Appendix）。统计分析部分，同样有一个非常长的附件，可以看到关于统计分析部分的附件内容非常详细。

连续变量的分组方法和依据

如果研究涉及连续变量，比如年龄，在研究的时候，可能不只是把年龄作为一个连续变量进行分析，还可能将年龄作为分类变量纳入统计分析。此时，则需要在统计分析部分，对上述内容进行阐述，包括如何进行分组、分组界值是什么、界值确定的依据是什么。

下图的文章中涉及格拉斯哥昏迷评分，该信息在数据收集时为连续变量，作者在数据分析时将其作为二分类变量进行分析。作者在统计分析部分对其如何进行分组、分组界值、以及界值确定的依据均进行了阐述：低于 8 分的患者为严重脑损伤，9 分以上为稍轻度脑损伤，然后检验两组之间其他指标的差异。

主要和次要结局的统计分析方法

在统计分析方法部分，最重要的部分之一就是描述主要结局和次要结局的统计分析方法。

0 (3).png

上图的案例很清楚地描述了在统计分析部分，主要结局指标是什么，次要结局指标是什么。对于主要指标以及部分次要指标采用协方差分析（ANCOVA），辅以重复测量分析。对于协方差分析，文章清楚地阐述了设定哪些变量作为固定效应，哪些变量作为协变量。

0 (4).png

下图是另一个案例，主要结局的统计分析方法是一个混合效应模型。文章也非常清楚的阐述了哪些变量作为固定效应，哪些变量是作为随机效应。

0 (7).png

下图是一项队列研究的文章，采用 Cox 比例风险模型来评估大气污染物PM2.5对急性鼻咽炎的影响。文章涉及两个模型，一个是单变量模型（Model 1），一个是多变量模型（Model 2）。在Model 2中，作者把调整的其他变量全部列出来，比如性别、年龄、 BMI等，有的文章甚至会详细地描述变量是分类变量，还是连续变量。因此其他研究人员根据数据就可以复制统计分析的结果。

0 (8).png