什么是置信区间?及其重要性_统计与绘图_实用技巧

医学研究，特别是随机对照试验，置信区间非常重要。但它在中文论文文献中被长期忽视，因而我今天特地来科普下。

统计分析结果中，P值很重要。人人都爱P值！但光光这一“屁用”的值是不够的。我一直在说，统计分析报告，要效应值、P值、置信区间三者皆俱。

先举个例子：一项临床试验，研究对象是高血压患者，随机被分为两组，分别用药物联合运动锻炼（试验组）和药物（对照组）进行血压控制，对每人治疗前、后收缩压（mmHg）进行测量，剔除失访人群后，分别得到实验组和对照组血压下降值，比较两组人群血压下降值有无统计学差异。

在这个案例中，探讨联合干预相对药物干预的效果，要解决的的几个关键问题：

第一，到底有没有效果？

第二，有多大的效果？

第三，有效果的可信度高不高？

大多数中文论文只回答了第一个问题，也就是到底有没有效果。

比如采用两样本t检验来进行分析，如果存在着统计学差异，那么我们会说：试验组、对照组干预前后差值差异具有统计学意义（P=0.005）

但是这一统计结果没有回答干预措施到底有多大的效果。统计学效果指的是效应值。

在本例研究中，效应值是4.70 mmHg。

但是光报告效应值还不够，我非常强烈建议同时报告效应值的置信区间，一般是95%的置信区间。

1. 什么是95%置信区间

置信区间，英文是Confidence Interval ，缩写是 CI，所以95%置信区间，又称为95%CI，它是关于总体参数不确定性的描述。

那么什么是总体参数呢？说来话长~~~

统计学是抽样研究，通过抽取一定数量的样本来开展分析。比如，我想了解所有人服用高血压药物的疗效。但是，我总不能所有人都调查一番，一般是抽取少量人，比如300人，询问他们高血压服用后血压下降水平。接着，经统计发现300人血压平均下降20.5mmHg。这个20.5我们称之为样本的信息，或者专业术语是统计量。但是20.5mmHg不全是我想要的，我想知道所有人服用高血压药物后的疗效是多少。

于是需要进一步分析，根据20.5 mmHg的信息去猜总体的信息，总体的信息就是参数。

但是猜总体，能够猜得准吗？猜不准！统计分析只能猜个大概！

于是，猜出总体的过程中，诞生了两个同出一源的概念，P值和置信区间。

首先是P值。对于非统计专业人士来说，P值可以认为两组均数总体上没有差异的概率（注意：这是不太正确的说法，但是对于非统计专业人士来说，这样理解没问题）。比如，试验组、对照组干预前后差值差异具有统计学意义（P=0.005），意味着，疗效没有差别的概率不到千分之五！所以我们认为有差别。

因此，这个P值其实是一个粗暴、武断的结论，它只回答了"到底有没有差别"这个问题。

而置信区间则告诉我们：它们差别是多大！

我刚才算出来两组差值是4.70，这意味着总体上两组疗效真的差4.7 mmHg吗？不是的，这个差别是样本的差别，总体还没有猜呢？

实际上，我们无法准确猜出总体的位置，只能猜总体大概的位置，所以总体值一般是一个区间。你看它的英文：Confidence Interval，意思是信心区间。因此，95%置信区间可以通俗地（但不完全正确）理解为总体均数有95%的可能性落在这一区间内（这个理解虽然但不完全准确，但对于非统计专业人士，这样理解没有毛病）。

因此，我们的结果就很丰富了:

•试验组、对照组干预前后差值差异具有统计学意义（差值4.70，95%CI1.48-7.91，P=0.005）

0 (2).png