文章目录

  • 1 METHODS
  • 1.1 Patients and Study Design
  • 1.2 Prognostic Signature
  • 1.3 Statistical Analysis
  • 2 RESULTS
  • 2.1 Prognostic Signature Generation
  • 2.2 8-Gene Prognostic Signature Validation
  • 2.3 The 8-Gene Prognostic Signature Is Independent of Other Clinicopathological Factors
  • 2.4 Stratifification Analysis
  • 2.5 Survival Prediction by Stage and 8-Gene Signature Combination
  • 2.6 Relationship Between the Prognosis Signature and Disease-Free Survival


1 METHODS

文献地址

1.1 Patients and Study Design

1331个患者GSE31210226名患者GSE37745165名患者GSE50081181名患者TCGA中有759名患者,包含TCGA-LUSCTCGA-LUAD(共1023名患者),只需要早期患者(NSCLC)759名

GEO芯片平台是:Affffymetrix U133 Plus 2.0 microarray platform。

四个数据集选取共同的预后基因,根据预后基因构建风险得分模型,在四个数据集和整个队列进行验证。

crunchy postgres 部署_Group

1.2 Prognostic Signature

采用单因素Cox比例风险回归模型,评价基因表达与非小细胞肺癌患者总体生存率的关系。
采用单因素Cox回归分析的风险比(HR)从每个数据集中识别与总体生存相关的候选基因HR<1的基因被认为是保护基因HR>1的基因被定义为危险基因。只有四个数据集之间的共同基因被筛选,以构建预后特征。
crunchy postgres 部署_回归分析_02
crunchy postgres 部署_回归分析_03 表示预后基因的数目,crunchy postgres 部署_数据集_04 表示 crunchy postgres 部署_Group_05 的表达量,crunchy postgres 部署_回归分析_06 表示 crunchy postgres 部署_Group_05univariate Cox regression analysis中的系数,使用median risk score作为截断值,将NSCLC病人分为高低风险组,此外,还在GSE31210,GSE37745和GSE50081三个队列中研究了无疾病生存(DFS)和预后之间的关系。

1.3 Statistical Analysis

Kaplan-Meier method比较高低风险组的生存时间,log-rank test进行显著性检验,多因素比例回归分析和分层分析评估风险得分是否为一个独立的预后因子ROC曲线中的AUC面积评估预后模型的性能,显著性检验阈值为p<0.05

2 RESULTS

2.1 Prognostic Signature Generation

对四个数据集中都存在的18638个基因,进行单因素比例风险回归分析寻找与总体生存相关的候选基因

dataset

p<0.05,HR >1

p<0.05,HR <1

GSE31210

2,131

2,280

GSE37745

913

762

GSE50081

1,107

871

TCGA

997

666

共得到8个共同候选基因,其中有3个危险基因,5个保护基因。分别是:CDCP1,HMMR,TPX2,CIRBP,HLF,KBTBD7,SEC24B-AS1 and SH2B1。其中(CDCP1,HMMR,TPX2,CIRBP,HLF,KBTBD7,and SH2B1)是mRNA,SEC24B-AS1是lncRNA

crunchy postgres 部署_回归分析_08

2.2 8-Gene Prognostic Signature Validation

根据风险得分中位数将样本非为高低分组,对8-gene信号的风险得分排序,展示风险得分的分布,8-gene的表达值,患者的生存状态(死亡/存活)。

crunchy postgres 部署_Group_09


crunchy postgres 部署_数据集_10


对高低风险组患者总体生存时间进行生存分析发现,低风险组有更长的总体生存,ROC曲线表明8-gene预测模型预测效果良好。

crunchy postgres 部署_数据集_11

crunchy postgres 部署_数据集_12


低风险组的患者趋向于表达保护基因,高风险组患者趋向于表达危险基因。GEO数据进行crunchy postgres 部署_Group_13变换,TCGA数据进行crunchy postgres 部署_数据集_14变换。

crunchy postgres 部署_回归分析_15


crunchy postgres 部署_Group_16

2.3 The 8-Gene Prognostic Signature Is Independent of Other Clinicopathological Factors

为了评价作为独立预后因子的8-gene模型的作用,使用stepwise method进行multivariate Cox regression analysis 协变量包括基因特征和临床病理因素,如年龄、性别、分期、组织学类型、基因突变、吸烟和表现状况等。结果表明,在4个独立数据中,8-gene信号的预测能力与其他临床病理因素对早期非小细胞肺癌患者的整体生存无关。
IB期是辅助化疗的指征。单因素和多因素Cox回归模型表明GSE 37745的IA/IB分期与患者的整体生存密切相关,但在其他三个队列中,IA/IB期与总体存活率没有任何显著关联。

crunchy postgres 部署_crunchy postgres 部署_17


crunchy postgres 部署_数据集_18

crunchy postgres 部署_crunchy postgres 部署_19

2.4 Stratifification Analysis

在多因素Cox回归分析中,多个临床病理因素也被认为是独立的预后因素。进行分层分析,以评价8基因信号是否能预测同一临床因素亚组中患者的生存。根据临床情况,在整个队列中进行人工分层,如年龄(≤65/> 65),性别(女/男),阶段(I / II)和组织学类型(腺/鳞状)。结果表明,8基因信号可以将同一年龄、性别、分期和组织学类型的患者分为高危组和低危组。高危患者 总生存期短于每一阶层风险分数低的人。

crunchy postgres 部署_回归分析_20


crunchy postgres 部署_crunchy postgres 部署_21

2.5 Survival Prediction by Stage and 8-Gene Signature Combination

在所有四个独立数据集和整个队列中,分期和风险评分被证明是独立的预后因素。因此,我们尝试将这一阶段与8-基因信号相结合,建立一种预测生存的预测模型。根据患者的分期和风险评分,将患者分为6组。
分组:

  • Group 1 (Stage IA and Low risk)
  • Group 2 (Stage IA and High risk)
  • Group 3 (Stage IB and Low risk)
  • Group 4 (Stage IB and High risk)
  • Group 5 (Stage II and Low risk)
  • Group 6 (Stage II and High risk)

结果显示,第2组患者的预后比第1组患者差,第4组的结果比第3组的更糟,而第6组的结局比第5组的结局更差。而第2组与第3/5组患者的总生存率无显着性差异(P>0.05)。此外,第4 组和第5 / 6 组在总体存活率方面没有观察到差异。这些结果提示,IA期高危评分的患者可能与IB期和II期的低风险评分患者有相似的预后。建议对具有高风险评分的IA期患者也应使用辅助化疗。6组中,1组预后最好,6组预后最差。值得注意的是,在综合数据集中,IA阶段与IB阶段的总体生存期存在差异。

crunchy postgres 部署_数据集_22


crunchy postgres 部署_数据集_23

2.6 Relationship Between the Prognosis Signature and Disease-Free Survival

与低风险组相比,高危组非小细胞肺癌患者无病生存时间更短,更高的AUC代表着更好的表现。

crunchy postgres 部署_Group_24


crunchy postgres 部署_回归分析_25