科研星球

网状Meta分析背后的原理是什么?

Meta分析已经成为现在临床决策中非常关键的一部分,而网状Meta分析作为Meta分析的拓展,也在近些年被大力发展并应用于临床决策。为了区分,我们通常称传统Meta分析为pairwise Meta分析,其应用在仅有两种干预比较的情况下。而当干预超过两种时,pairwise Meta分析则不再适用,此时需要引入新的比较方法,即间接比较(indirect comparisons)。

1.间接比较和网状Meta分析

当我们有两对干预比较(A vs B、A vs C)的数据时,间接比较B vs C很自然的就产生了,表示为AB直接比较的结果(dAB)减去AC直接比较的结果(dAC),即

 

640.png

的确,我们可以通过AB、AC的数据来获得BC比较的数据,但这却不是最主要的目的。事实上,更多的情况是需要得到这三种干预中哪一个是最优的。而为了进行这些比较,我们需要一个假设,即不同试验中的效应量(如RR、RD等)在适合的尺度下必须相对稳定,尽管它们中每一组的response rate本身会变化。这是整个Meta分析中最基本的假设,也就是所谓“同质性假设”。


到此为止,我们进行的比较都非常简单,然而,当出现环路结构(loop)时,情况则变得复杂了一些。如图1中的闭合环路结构,假设我们有两个dBC的来源:(1)来自B vs C的直接比较数据,即关于BC的RCT,(2)来自AB、AC的间接比较数据。此时我们需要将dBC的两个来源数据合并,形成一个合并值。同时,我们也可以测试这两个来源数据即直接比较和间接比较的一致性。


下载.jpeg

图1


网状Meta分析的首要任务则是简单的将所有数据合并,通过某种“一致”的方式。那么什么是“一致”呢?回到图1中,假设现在分别进行3个不同的pairwise Meta分析,分别得到3个不同的结果:

 

640 (1).png

然而,这三个结果并不能得到一个一致的决策来决定谁是最优的干预。一个简单的例子假设A、B、C三个人的体重比较为:A比B重2kg,B比C重3kg,那么我们应该得知A比C重5kg。然而此时我们又得知A比C仅重2kg,那么我们无法得出哪个人最重,因为出现了不一致


同理,在刚刚3个分开的pairwise Meta分析中,我们需要的不是那3个直接比较的且不一致的结果,而是需要3个一致的估计,同时它们满足:

 

640 (4).png

事实上,网状Meta分析即是一种“得到一致估计的方法”,因而得到一致的决策。在某种意义上,pairwise Meta分析和间接比较都是网状Meta分析的特殊例子。

2.非参数方法

如前所述,间接比较是两个直接比较的差,即dBC=dAC-dAB。而间接比较的方差估计则是两个直接比较方差的和,因为不同试验中涉及不同研究人群且相互独立,即:

 

640 (5).png

因此,间接比较的方差永远大于其中任意一个直接比较的方差,且随着其成分数量增加,方差会变得很大。


此时,将上述计算继续拓展,当同时存在直接比较和间接比较时,我们可以将二者合并为一个估计值。例如,假设在三角环路结构中(同三角形),存在3个试验,分别为干预A vs B、B vs C、A vs C。我们可以分别计算3个pairwise Meta分析合并值和相应方差,即:

 


此时对于dBC来说有两个估计来源,即直接比较和间接比较,使得我们需要对其进行合并,例如使用倒方差加权(inverse-variance weighting, IV):

 

640 (3).png


同理,我们也可以计算出其余两对比较的合并值。此时相比于最开始不一致的3个直接比较而言,我们得到了3个一致的合并值。尽管整个过程需要重复3次,但是我们仍然可以通过简单的计算机程序去运算。


然而,当干预数量增加时,需要计算的直接比较pairwise Meta分析估计值数量便飞速向上增长,例如干预数量为3、4、5、10、30,则相应pairwise估计值数量为3、6、15、45、445,即S(S-1)/2,因此,整个过程变得非常繁琐。所以,我们需要的是一个能同时计算全部数据并产生一致估计值的方法,以及检验每个干预的直接比较和间接比较之间是否具有一致性。这便是网状Meta分析的核心内容。

3. 一些假设

前述提到网状Meta分析是pairwise Meta分析的拓展,因此,当说到网状Meta分析时,首先应该说的是pairwise Meta分析的假设,即同质性假设。意思是同一干预比较中不同RCT的效应量应该是近似一致的,仅有的差别是由于随机误差导致的。简单来说就是不同RCT之间“不存在效应修饰的作用”。


那么在网状Meta分析中,同质性假设变:在试验A vs B中,dAB的值应该等于,在试验A vs C或B vs C等试验中假如存在干预A vs B时dAB的值。当然,如果是随机效应模型,同质性假设变为:在试验A vs B中存在不同的di,AB的值(即trial-specific effect),每一个值都是抽样自指定的随机效应分布,这个分布的均值是dAB,方差是σAB2。且如果其他试验(AC、BC等)包含AB,那么它的估计值dj,AB也抽样自同一随机效应分布。


上述同质性假设也可以从另一个角度来理解,假设现在全部RCT均是多臂试验(multi-arm trials)且干预有ABC等,然而,由于某些原因,其中仅一部分干预报告了,其余干预均被随机丢失(missing at random,rubin 2002)。因此,干预AB是同质的。


如前所述,这个同质性假设是全部类型的Meta分析均存在的,并不仅仅局限于网状分析中,因此,试图以此为借口仅攻击网状Meta分析是站不住脚的,除非连pairwise Meta分析一起质疑。这是另一个话题,在此不多说了。


同质性假设的存在时刻提醒我们,在纳入文献时要“小心”,制定的纳排标准要尽可能使研究同质。当然,也使得我们开发出一系列方法来减轻异质性带来的问题,如covariate adjustment和bias modelling。


对于纳入研究的数据也会存在各种各样的潜在问题,例如研究人群与临床仅部分相关(即外部真实性),试验本身可能出现随机分配失败、盲法失效、失访数据等等(即内部真实性)。


通常情况下,我们可以对它们的质量进行评估,如Cochrane Risk of Bias tool评价RCT质量。


但是评估质量的局限性在于,其无法对现存数据的缺陷进行改变,只能通过降级的形式来表现。而我们这里需要的是通过系列方法减轻这些缺陷,从而基于现有不完美的证据得出最优解。


首先,我们需要熟悉网状Meta分析的所有假设,在此基础上尽最大可能使收集的数据满足这些假设,同时这些数据需要直接回答临床决策问题。第二,当分析时出现一些不可避免的效应修饰时,我们通过多变量meta回归的方法校正协变量。第三,当出现一些潜在的偏倚时,使用bias adjustment的方法进行处理。

4. 什么研究应该纳入网状比较

当我们做网状Meta分析时,理论上可以把全部干预涉及的所有RCT都纳入进来,但是这样做会产生一系列问题。在评价一种新药时,有两种不同的方法比较,其一是将新药和一种或多种标准干预相比,如果新药更好或更cost-effective,那么就做一个推荐。其二是将新药和所有标准干预以及所有相互竞争的其他新药相比,然后选其中最好的药。


这两种方法是截然不同的,例如我们的“选择最好”方法,将全部标准药与全部新药共同比较,如果这样,最终的决策体系也需要基于这种比较空间,也就是基于相同的试验集和相同的网状Meta分析。然而,这种情况下,“证据空间”和“决策空间”并不能很好的相容或保持一致。事实上,我们“选择最好”的过程并不应该基于全部干预,相反应该基于与临床决策相关的干预进行


但是,当我们仅纳入临床决策相关的干预时,并不一定总能成网,也就是干预和干预之间可能是两个分离的小网状结构,或分离的几个网状结构,这种情况也很不理想。因此,我们这里给出一个选择准则


(1)首先找出全部临床决策相关的干预。

(2)找出决策相关干预的全部试验。

(3)将多臂试验中不相关的干预去掉。如果此时依然成网状结构,则结束。

(4)如果上述无法成为网状结构:a)寻找在两个分离的网状结构中共有的干预比较。b)纳入这些比较。c)重新执行步骤(2)、(3)。


这个步骤可以保证识别出相关临床决策面的最小试验集,当然,也并不能保证干预之间一定成网状结构。同时,选择的过程依然保留了主观的意愿,因此目标人群的选择仍然需要领域内相关知识的结合。

5. 网状结构——定义干预和结局

在这里首先需要强调,我们的网状Meta分析全部基于随机对照试验(RCT),尽管我们后面还会介绍一些bias modelling的方法使得可以校正一些潜在的偏倚。此外就是通常我们会使用multiplicative scale的效应量(如RR、OR),也就是意味着我们不能纳入单臂试验。除上述外,网状结构的建立其实就是如何定义干预和结局的问题。在pairwise meta中,我们通常使用PICOs的框架来制定,然而在网状Meta中我们需要适当的对I、C、O进行修改。


5.1 干预的合并和分离


在pairwise meta中,有时会把一些“不太一样”的干预进行强行合并,以达到纳入足够的研究进行定量分析的目的。在网状Meta中,天然的可以分析多种不同干预,或者相似的干预也可以全部分开进行分析。如在一般网状Meta中,所有不同的干预、不同的剂量、不同的组合,均视为不同的“干预单元”,并且地位相等。


这样做的问题在于,当不同干预之间划分越细,无法连成网状结构的风险越大。通常情况下,我们可以使用一些特殊的方法来处理,例如dose-response model、treatment combination models、class effects models。这些方法有时可以极大的减少被估参数的数量,从而增加统计功效。


5.2 多重结局


另一种增加网状结构连接的方法是纳入多个彼此相关的结局进行分析。通常一些试验会同时报告一个结局在多个随访时间点的值,然而,当我们限制在仅估计其中一个特定的结局时,结果可能会非常稀疏,或者无法连网。但当我们可以同时使用多个结局的信息时,连接更紧密效率更高的模型将可以被使用,然而这样的模型也并非很容易建立,在这里就不多论述了。


5.3 网状结构的大小


理论上,越大的网状模型,结果越稳健。然而,当纳入大量不同的试验时,人群异质性也会相应增加。当异质性增加时,模型中研究间方差也会增加,最终降低估计的精确性。除此之外,异质性也可能导致直接比较和间接比较之间的不一致性。所以这也是需要权衡的一点。


附1:网状Meta分析的小历史


“Network meta-analysis”这个词最早在Lumley(2002)的文章中提出,当然还有一些其他的叫法,如mixed treatment comparisons、multiple-treatments meta-analysis。网状Meta分析的雏形可以追朔到1992年Eddy的Confidence Profile Method,其中同时使用了间接比较和类似于网状比较的“chain of evidence”。


另一个网状Meta的分支源于Cooper and Hedges(1994)的书Handbook of Research Synthesis,其中一个章节,Gleser and Olkin描述了合并多个试验中多种干预的一个方法。


除此之外,Heiner Bucher和Gordon Guyatt等(1997)一起讨论了meta分析中的直接比较和间接比较。


而在1年前,Julian Higgins和Anne Whitehead(1996)提出了两种不同的策略,其一是在随机效应模型中使用外部数据来估计异质性参数,另一个是针对指定干预比较对直接比较和间接比较结果进行合并,同时基于假设它们可以估计相同的参数。事实上这个想法最终形成了网状Meta分析的核心模型(Lu and Ades, 2004, 2006; Ades et al, 2006),因此是非常具有意义的。

 

附2:一些题外话


现在做网状Meta分析的人越来越多,通常大家就是简单的将数据扔进程序中,跑一下然后出来看结果。然而,对它背后的原理却不是很清楚,以至于可能会出现各种各样潜在的问题。作为医学生,虽然并不需要完全了解模型背后的全部机制,但也不能完全不了解。很多情况下,模型的机制和假设是与临床意义息息相关的,比如我们应该如何解释有异质性时的结果,或存在不一致性时的结果,以及应该如何处理以减轻它们的影响。


如果顺利的话,这个网状Meta分析的介绍可以写成一个系列文章,系统的讲述一下网状Meta分析中的全部内容。事实上,这个系列文章并不准备写如何“做”一个网状Meta分析,做网状Meta分析的软件或程序有很多且操作简单,并不需要我多说,因此,本系列文章准备着重写一下网状Meta分析背后的原理和一些方法,以及为什么它可以支撑临床决策

 

References

1.Ades, A. E. & Sutton, A. J. 2006. Multiparameter evidence synthesis in epidemiology and medical decision making: current approaches. Journal of the Royal Statistical Society: Series A (Statistics in Society), 169, 5–35.

2.Bucher, H. C., Guyatt, G. H., Griffith, L. E. & Walter, S. D. 1997. The results of direct and indirect treatment comparisons in meta‐analysis of randomized controlled trials. Journal of Clinical Epidemiology, 50, 683–691.

3.Cooper, H. & Hedges, L. 1994. The Handbook of Research Synthesis, New York, Russell Sage Foundation.

4.Dias, S., Ades, A. E., Welton, N. J., Jansen, J. P., & Sutton, A. J. (2018). Network meta-analysis for decision-making. John Wiley & Sons.

5.Eddy, D. M., Hasselblad, V. & Shachter, R. 1992. Meta‐Analysis by the Confidence Profile Method, London, Academic Press.

6.Higgins, J. P. T. & Whitehead, A. 1996. Borrowing strength from external trials in a meta‐analysis. Statistics in Medicine, 15, 2733–2749.

7.Little, R. J., & Rubin, D. B. (2019). Statistical analysis with missing data (Vol. 793). John Wiley & Sons.

8.Lumley, T. (2002). Network meta‐analysis for indirect treatment comparisons. Statistics in medicine, 21(16), 2313-2324.


没有账号?