科研星球

NEJM:随机试验面临困难,但真实世界证据并非解决之道

随机对照试验正变得越来越复杂,成本也越来越高昂。因此有人主张通过非随机观察性研究代替随机试验,获得关于疗效和安全性的“真实世界证据”。


在《新英格兰医学杂志》(NEJM)的回音壁栏目,来自牛津大学临床试验服务中心的英国医学科学院院士Rory Collins教授等撰文批评了这些观点。在文中,他们指出随机试验程序的日趋复杂化背离了科学原则,但非随机观察性分析由于种种内在缺陷而无法代替随机试验;正确方法应该是消除随机试验诸多障碍,例如基于科学原则制定恰如其分的随机试验管理办法、通过技术手段推进患者入组和随访等。


大规模患者电子数据库非随机观察性分析正被推动成为随机临床试验替代方法,作为有关新疗法和现有疗法疗效和安全性的“真实世界证据”来源。对于已经广泛应用的药物或操作,此类观察性研究可能有大量患者接受治疗。因此,它们有可能发现难以归因于偏倚(通常是因为相对危险度较大)的罕见不良效应(例如与使用阿司匹林相关的瑞氏综合征,或者与使用他汀类药物治疗相关的横纹肌溶解)。非随机临床观察也可能在未预期有良好结局情况下,发现较大有益效应(例如应用胰岛素可控制糖尿病酮症酸中毒,或者化疗可使肿瘤快速缩小)。


然而,由于观察性研究固有的潜在偏倚,当关注的治疗效应实际不存在或只有微小效应时(即应用和不应用该疗法之间的健康结局发生率差异小于两倍),而这又是常见状况,此类研究通常并不可信。在这种情况下,大规模观察性研究可能在治疗与健康结局之间得出有误导的关联(两者之间有统计学显著性关联,但无因果关系,或者在治疗实际产生临床重要效应的情况下被错误地认为无效)。实际上,为了确保对治疗的微小益处或微小危害做出可靠评估,从而正确地指导患者治疗,通常需要开展达到足够规模的随机对照试验(表1)。


表1. 推动随机化,加强患者治疗,保护公众健康。

0.png


依赖非随机观察性研究可能导致对安全性和疗效的评估不充分,因为这两方面的潜在偏倚可能相当大。例如,正在评估的疗法可能更常或不常提供给各种健康结局风险增加或减少的患者。事实上,这是医疗实践中可预期的状况,因为所治疗疾病的严重程度和是否患其他疾病都可能影响治疗方案的选择(并且通常是以无法可靠量化的方式产生影响)。


对接受治疗患者和未接受治疗患者之间的所有已知差异进行校正后,即使各种健康结局与特定疗法的关联仍具有统计学显著性,这些校正后的关联反映的可能仍然是残留混杂因素,因为存在未完全评估或完全未评估的因素差异(因此这些因素无法在校正分析中全面考虑)。


建模研究表明,观察性研究中的潜在偏倚很可能大到足以得出关于治疗有益或有害的错误结论,且各种统计学策略中没有一种可以明确地校正偏倚。这些发现与比较观察性研究中疗效估计值与随机试验中疗效估计值的综述的发现是一致的,其中有相同干预得出相似结果的例子,但也有许多结果显著不同的例子。


上述差异在纳入丹麦整个人群的一项数据库分析中显现出来,该分析发现,即使对已知潜在混杂因素进行统计学校正之后,仅服用他汀类药物几年的患者的癌症死亡相对危险度仍比未服用他汀类药物的患者低15%(95%置信区间,13~18)。同样,在其他一些非随机研究中,他汀类药物也与癌症发病率降低相关(例如,在一项此类研究中,服用他汀类患者的结肠癌发病率约为未服用他汀类患者的一半)。


与之不同,在对多项随机试验,共计超过10,000例新发癌症病例的个体患者数据进行的荟萃分析中,在他汀类药物的平均5年治疗期间(暴露时间超过观察性研究)和之后长期随访期间,他汀类药物对癌症发病率和癌症死亡率均无明显影响(不论是整体还是特定研究中心)。


关于心血管原因死亡的结果则正相反,随机试验观察到他汀类药物有助于降低心血管原因死亡率的确实证据,而在丹麦研究中,服用他汀类药物患者的心血管原因死亡率比未服用他汀类药物的患者高约四分之一(推测其原因是较高风险促使医师开出他汀类药物)。尽管上述死亡率增幅在多项统计学校正之后有所减小,但该研究仍无法检测出他汀类药物所具有的降低心血管风险的效果。


随机化的“神奇之处”在于,它保证形成已知和未知危险因素(无论这些危险因素是否经过评估)均平衡,因此各类健康结局风险平衡的患者组。然后,通过在随机分配到研究治疗组和非研究治疗组的患者之间以相似方式确认健康结局,实现对试验治疗效果的无偏倚评估。对于主观健康结局(如症状或情绪),这一过程通常需要将分组结果设盲(这一点在利用临床数据库的观察性研究中是做不到的)。


对随机试验中所有患者的持续随访(即使其中一些人已停止分配的治疗)可维持通过随机化所实现的类似人群比较(即使在随机分配的各组之间,未依从所分配治疗的患者的特征有所不同)。因此,在随机试验中,基于意向性治疗比较的组间健康结局发生率差异可归因于与所评估治疗之间的因果关系(前提是统计学检验表明差异不太可能由偶合现象导致,并且避免了在特定试验或特定亚组中,对结果的过度数据依赖性强调)。


外推随机试验的结果时,我们持有的假设并不是所研究的患者群体代表所有患者,而是所研究的治疗对每项特定健康结局的比例效应在不同情况下应该是相似的,除非有充分理由预期不同结果。因此,要获得某一疗法的绝对获益和危害的有效估计值,可将随机试验中所关注每项结局的比例效应的可靠证据应用于特定人群观察性研究中这些结局的绝对发生率。例如,在纳入闭塞性血管事件高危患者的二级预防策略随机试验中,其信息可用于估计较低危一般人群的一级预防效果。


在应用非随机观察性研究来评估疗效的动力中,有部分源自当前随机试验的成本和复杂性。在过去25年间,管理临床试验的规则和相关机构大幅增加,其目的是提高试验参与者安全性和结果可靠性。然而,过度关注遵守规则(过度解读规则加剧了这一点),而不是随机试验的科学原则并不一定能提高试验质量或患者安全性,但确实增加了复杂性。因此,制药公司越来越依赖合同研究组织行业来开展临床试验,该行业的年收入也呈指数级增长,从20世纪90年代初的约20亿美元增长至2019年的400亿美元。与此同时,在工业界资助的试验中,学术研究人员的科学贡献已经减少,以前的创造性伙伴关系模式在很大程度上被涉及新兴学术研究组织行业的服务合同所取代。


此外,药物开发的方向发生了可能会对公众健康产生不利影响的变化。例如,在过去十年中,如果统计美国销售量最大的10种药物,它们的销售收入增加了2.5倍,而目标患者人数却减少了7.5倍。这一趋势可能反映出目前通过大规模随机试验在常见疾病中检测出重要增量效应的高昂成本,因此药物开发的方向转向了通过较小规模试验为不太常见的疾病寻找效应较大的疗法。


还有证据表明,为了控制成本,试验的参与者纳入标准变得更加严格,而试验持续时间缩短;这两个因素降低了疗效和安全性证据的普遍适用性和可靠性。然而,对于过去25年间,官僚主义施加在随机试验上的越来越沉重的负担,其解决方案并不是用不可靠的非随机数据库分析来代替随机化。相反,应该消除在适当规模的随机试验中可靠评估疗效和安全性所面临的不必要的障碍(表2)。


表2. 提高新干预措施和现有干预措施的随机试验质量和效率的机会。

0 (1).png


官僚主义施加负担所造成的的一个后果是增加了试验招募患者的难度,这导致的趋势是在许多国家设立共计数百个研究中心,而每个研究中心只招募少量患者。一个更好的替代方案是通过日益普及的电子病历发现大量符合纳入标准的患者,从而大幅减少研究中心数量,快速招募患者(进而降低成本并提高试验质量)。


例如,在英国,研究者通过检索全国医院记录的方式,为关于降胆固醇疗法的一系列随机试验有效发现并招募了符合纳入标准的患者,而瑞典已通过心脏病患者登记系统开展数项研究,并且目前该系统正扩展到整个欧洲。此外,避免设立过分严格或具体的纳入标准(这样的标准往往需要收集和核实资格信息,既费钱又费时)也有助于招募患者;该方法也有助于确保随机试验结果更广泛地适用于相关患者群体。


成本高昂但相对无效的试验监查策略(如检查原始文件和频繁检查研究中心)得到了监管指南的支持,并被许多研究资助方、稽查员和监管视察员执行。然而,与其关注如何在问题发生后(往往为时已晚)发现它们,还不如在设计试验时建立防止出现实质偏离的系统。例如,应用交互式电子病例报告表不仅有助于收集所需的全部数据(因为不会遗漏项目,并且需要时可查找更多数据)和提高所收集数据的一致性,而且可提高对研究方案的依从性(例如,通过内置的纳入标准检查机制,以及需要特定行动[如实验室安全性检测]时发出的提示)。此外,实时电子数据传输有助于高效集中监查患者安全性和研究中心表现,而快速反馈有助于改进表现。


与中央记录系统建立链接可在试验的治疗期间以及更长时间内,增强对各类健康结局的检测,从而更全面地评估某一疗法。评估试验治疗对这些结局的影响时,通常是直接基于记录系统,因为随机试验中,各组之间比较的可靠性通常不会因裁定记录的健康结局(通常需要根据过分具体的定义,耗费大量时间收集和评估数据)而得到实质改善。


例如,在关于他汀类药物的一项试验中,基于在健康记录系统中回顾性确定的结局进行随机比较时,与基于试验治疗期间记录的经裁定结局进行的随机比较并无实质差异;此外,前者可显示长期随访期间的更多益处。技术进步使我们可以评估更大范围的健康结局(如在智能手机支持下评估生活质量、情绪和认知,以及通过数字传感器监测功能指标)。


总之,在如何确保患者接受安全有效治疗方面,我们面临严重问题,而通过非随机观察性分析代替随机试验是一个错误的解决方案。美国食品药品监督局支持的临床试验转型倡议(Clinical Trials Transformation Initiative)表明,制定出可改进随机试验设计和实施的指南是可行的。现在迫切需要制定全面指南,这些指南应该基于随机对照试验的科学原理,关注对产生可靠结果和确保患者安全真正重要的方面,并利用技术进步扩大随机证据的范围。这些指南不仅与促使新干预措施获得监管批准的各个临床开发阶段相关(因为减少造成浪费的做法有助于研发出更多疗法),也与现有疗法的非商业性随机试验相关(因为如果使更多此类试验的成本可负担,将改进患者治疗,促进公众健康)。



参考文献

Collins R, Bowman L, Landray M, et al. The magic of randomization versus the myth of real-world evidence. N Engl J Med 2020;382:674-678.


没有账号?