科研星球

疾病亚型分析如何做出新高度?PNAS也能发!

大家好!今天给大家介绍一篇2022年10月发表在PNAS(IF:11.205)上的一篇文章。这篇文章使用转录组数据对急性髓系白血病患者进行亚型分型并鉴定不同亚型之间的临床和预后差异。


Transcriptome-based molecular subtypes and differentiation hierarchies improve the classification framework of acute myeloid leukemia

基于转录组数据的分子亚型和聚类改进急性髓系白血病的分类框架


摘要

目前急性髓系白血病(AML)的分类主要依赖于基因组改变。如何从非基因组数据中稳健的识别具有临床和生物学意义的分子亚型仍然十分具有挑战。作者使用中国最大的多中心AML队列的转录组数据和靶向测序/全外显子组测序数据集进行一致性聚类,共鉴定到8个具有临床和生物学意义的分子亚型(G1-G8),包括四个已知的低风险亚组和四个预后较差的亚组。此外,作者构建预测模型并同样鉴定到TCGA数据集的8个分子亚型。作者的研究揭示了AML复杂的分子网络,可能促进疾病发病机制的系统研究并促进基于组学的靶向药物筛选。


流程图

0.png


结果

1. 数据集的获取和下载

从上海血液研究所(SIH)获取442例原发性AML患者,江苏省血液研究所(JIH)获取110例原发性AML患者,浙江省血液研究院(ZIH)获取103例原发性AML患者的样本。655例样本均进行RNA测序,其中576例进行TES测序,43例进行WES测序。


2. 一致性聚类鉴定AML的分子亚型

在对三个转录组数据集进行批次校正后,作者进行一致性聚类共鉴定到8个稳健的分子亚型(G1-G8)(图1A和1B)。根据G1-G8亚组和WHO定义的AML最新分类的相关性来鉴定排名靠前的特征阈值(图1C)。其中,G1-G4与WHO分类中相对有利的遗传病变重叠。转录因子融合PML::RARA, CBFB::MYH11和RUNX1::RUNX1T1分为聚集在G1, G2和G3亚组中,G4亚组中几乎全部发生了biCEBPA突变和8例moCEBPA突变杂合度缺失及11例CEBPA野生型。然而,G5-G8亚组中缺乏单一的亚群特异性分子事件。G5亚组的特征为AML,骨髓增生异常相关(AML-MR)。G6-G8亚组包括NPM1突变,KMT2A和NUP98融合(图1C)。

0 (1).png

图1 根据转录组数据定义的AML亚群特征


与G1-G4相比,G5-G8亚组的HOXA/B和MEIS1表达水平较高(图2A)。涉及DNA甲基化基因,染色质修饰物和剪接体的基因突变富集在G5-G8中(图2B)。G5亚组中主要包括RUNX1, TP53, PHF6和继发性突变,这些突变通常在骨髓增生异常综合征(MDS)转化的AML中富集。G5亚组患者的单染色体核型和5,7,17号染色体异常更为复杂,而骨髓母细胞和白细胞计数较低(图2B)。G6-G8亚组中包含更多的NPM1突变,KMT2A和NUP98融合。G8亚组中DNMT3A/NPM1/FLT3-ITD的突变频率较高。然而,TET2和IDH2与NPM1/FLT3-ITD突变的并发在G7亚组中更为常见(图2B)。

0 (5).png

图2 不同亚组的临床和分子特征


3. 细胞分化阶段和基因表达亚群的调控特征

接下来,作者研究已知和未知亚群的内在转录失调情况。首先,作者将这8个亚群与FAB分类系统进行比较。结果表明,G1(PML::RARA),G2(CBFB::MYH11),G3(RUNX1::RUNX1T1)和G6分别对应于M3,M4,M2和M5。G4亚组对应于M1/M2/M4,G5亚组对应于AML/M2/M4/M5,G7亚组对应于M2/M4,G8亚组对应于M4/M5(图3A)。此外,不同亚型的免疫细胞丰度不同,其中G2和G6亚组中单核细胞和巨噬细胞丰度较高(图3B)。随后,作者参考已有的scRNA-seq数据集来确定不同分化状态的基因特征。结果表明,G1-G8亚组都富集不同的细胞类型特征(图3C)。G1和G3亚群具有gmp样细胞特征,而G2和G6亚组的分化单核细胞特征更为丰富。不同细胞类型的分子标记物在G1-G8亚组的表达水平不同(图3D)。作者使用流式细胞仪对36例G1-G8亚组样本进行分析,在G5,G7和G8亚组中CD34+CD38-组分在总白细胞中比例较高。此外,G1,G3和G4亚组的样本表现出粒细胞分化免疫表型而G2和G6则表现出典型的单核细胞分化。每个亚组中特征基因的表达水平如图3E所示。HOXA/B家族基因在G5和G6-G8中分别中表达和高表达。G5,G7和G8中LSC17上调表达。层次聚类表明了HOX混合亚群的中间状态,除了明确的基因集外还描绘了各个亚群中特征基因和BCL2家族基因的表达水平(图3E)。

0 (2).png

图3 分子亚组的细胞聚类和调控通路


4. AML亚组的预后价值

以G1的生存期作为参考,展示8个亚组的临床结局。尽管G2-G4亚组的总生存期较长但是有一部分患者发生了复发。此外,G5和G8亚组的患者预后最差而G6和G7亚组的患者预后较好。由于年龄对AML患者的生存期具有显著影响,作者将患者分为两个年龄组,其中G5和G8亚组的年轻患者(≤60)预后较差(图4A)。然后,作者研究不同分子亚组的内在异质性。G4亚组中,biCEBPA样基因表达特征的患者与携带biCEBPA突变的患者预后较好。然而,其他亚组中发生CEBPA突变的患者预后较差(图4B)。在G5亚组中,携带融合基因,转录因子,肿瘤抑制因子和剪接体突变的患者预后较差(图4C)。在G8亚组中,发生转录因子和其他遗传病变的患者比融合基因和NPM1突变的患者预后较差(图4D)。作者对non-M3 AML患者的数据集进行多因素Cox分析(图4E)。其中,年龄,男性,血小板,白细胞和LSC17危险打分均为不良预后因子。

0 (3).png

图4 分子亚型的预后价值


5. 基于转录组数据的分类预测模型有助于个性化风险适应性治疗

使用基于自动机器学习(AutoML)算法和不同的预处理步骤,可以准确预测8个基因表达亚型,预测精度中位数为0.95(图5A)。作者使用额外的AML数据集进行验证,均可以鉴定到G1-G8亚群并表现出相应的表达和分化特征(图5B和5C)。TCGA-LAML数据集中的G5,G6和G8亚组以及Beat数据集中的G5亚组患者预后较差(图5D和5E)。这些数据集的临床特征如图5F所示。基于Beat数据集的体外药敏数据预测不同亚组对不同药物的反应(图5G)。G1,G4和G5亚组对RTK的多种抑制剂表现出耐药性而G6-G8亚组对这些药物表现出高敏感性。总的来说,这些结果表明不同分子亚组的鉴定对AML的临床应用具有一定意义。

0 (4).png

图5 构建预测分子亚型的预测模型


结论

总的来说,作者基于转录组数据鉴定到的AML的分子亚组丰富了AML在临床上,形态学和基因上定义的亚型和预后分类系统,这可能构成该疾病细胞起源和基因型-表型关联的重要框架。然而,本研究的局限性在于还需要使用更大规模的数据集验证本研究的结果。



没有账号?