文章目录
- 1 METHODS
- 1.1 Patients and Study Design
- 1.2 Prognostic Signature
- 1.3 Statistical Analysis
- 2 RESULTS
- 2.1 Prognostic Signature Generation
- 2.2 8-Gene Prognostic Signature Validation
- 2.3 The 8-Gene Prognostic Signature Is Independent of Other Clinicopathological Factors
- 2.4 Stratifification Analysis
- 2.5 Survival Prediction by Stage and 8-Gene Signature Combination
- 2.6 Relationship Between the Prognosis Signature and Disease-Free Survival
1 METHODS
1.1 Patients and Study Design
共1331个患者
,GSE31210
有226名患者
,GSE37745
有165名患者
,GSE50081
有181名患者
,TCGA
中有759名患者
,包含TCGA-LUSC
和TCGA-LUAD
(共1023名患者),只需要早期患者(NSCLC)759名
。
GEO芯片平台
是:Affffymetrix U133 Plus 2.0
microarray platform。
四个数据集选取共同的预后基因,根据预后基因构建风险得分模型,在四个数据集和整个队列进行验证。
1.2 Prognostic Signature
采用单因素Cox比例风险回归模型
,评价基因表达与非小细胞肺癌患者总体生存率
的关系。
采用单因素Cox回归分析的风险比(HR)从每个数据集中识别与总体生存相关的候选基因
。HR<1
的基因被认为是保护基因
和HR>1
的基因被定义为危险基因
。只有四个数据集之间的共同基因被筛选,以构建预后特征。
表示预后基因的数目, 表示 的表达量, 表示 在univariate Cox regression analysis
中的系数,使用median risk score
作为截断值,将NSCLC病人分为高低风险组
,此外,还在GSE31210,GSE37745和GSE50081三个队列中研究了无疾病生存(DFS)
和预后之间的关系。
1.3 Statistical Analysis
Kaplan-Meier method
比较高低风险组的生存时间,log-rank test
进行显著性检验,多因素比例回归分析和分层分析
评估风险得分是否为一个独立的预后因子
,ROC
曲线中的AUC面积
评估预后模型的性能,显著性检验阈值为p<0.05
。
2 RESULTS
2.1 Prognostic Signature Generation
对四个数据集中都存在的18638个基因
,进行单因素比例风险回归分析寻找与总体生存
相关的候选基因
。
dataset | p<0.05,HR >1 | p<0.05,HR <1 |
GSE31210 | 2,131 | 2,280 |
GSE37745 | 913 | 762 |
GSE50081 | 1,107 | 871 |
TCGA | 997 | 666 |
共得到8个共同候选基因,其中有3个危险基因,5个保护基因。分别是:CDCP1,HMMR,TPX2,CIRBP,HLF,KBTBD7,SEC24B-AS1 and SH2B1。其中(CDCP1,HMMR,TPX2,CIRBP,HLF,KBTBD7,and SH2B1)是mRNA
,SEC24B-AS1是lncRNA
。
2.2 8-Gene Prognostic Signature Validation
根据风险得分中位数将样本非为高低分组,对8-gene信号的风险得分排序,展示风险得分的分布,8-gene的表达值,患者的生存状态(死亡/存活)。
对高低风险组患者总体生存时间进行生存分析发现,低风险组有更长的总体生存,ROC曲线表明8-gene预测模型预测效果良好。
低风险组的患者趋向于表达保护基因,高风险组患者趋向于表达危险基因。GEO数据进行变换,TCGA数据进行变换。
2.3 The 8-Gene Prognostic Signature Is Independent of Other Clinicopathological Factors
为了评价作为独立预后因子的8-gene模型的作用,使用stepwise method
进行multivariate Cox regression analysis
协变量
包括基因特征和临床病理因素,如年龄、性别、分期、组织学类型、基因突变、吸烟和表现状况等。结果表明,在4个独立数据中,8-gene信号
的预测能力与其他临床病理因素对早期非小细胞肺癌患者的整体生存无关。
IB期是辅助化疗的指征。单因素和多因素Cox回归模型表明GSE 37745的IA/IB分期与患者的整体生存密切相关,但在其他三个队列中,IA/IB期与总体存活率没有任何显著关联。
2.4 Stratifification Analysis
在多因素Cox回归分析中,多个临床病理因素也被认为是独立的预后因素。进行分层分析
,以评价8基因信号是否能预测同一临床因素亚组
中患者的生存。根据临床情况,在整个队列
中进行人工分层,如年龄(≤65/> 65),性别(女/男),阶段(I / II)和组织学类型(腺/鳞状)。结果表明,8基因信号可以将同一年龄、性别、分期和组织学类型的患者分为高危组和低危组。高危患者 总生存期短于每一阶层风险分数低的人。
2.5 Survival Prediction by Stage and 8-Gene Signature Combination
在所有四个独立数据集和整个队列中,分期和风险评分被证明是独立的预后因素。因此,我们尝试将这一阶段与8-基因信号相结合,建立一种预测生存的预测模型。根据患者的分期和风险评分,将患者分为6组。
分组:
- Group 1 (Stage IA and Low risk)
- Group 2 (Stage IA and High risk)
- Group 3 (Stage IB and Low risk)
- Group 4 (Stage IB and High risk)
- Group 5 (Stage II and Low risk)
- Group 6 (Stage II and High risk)
结果显示,第2组患者的预后比第1组患者差,第4组的结果比第3组的更糟,而第6组的结局比第5组的结局更差。而第2组与第3/5组患者的总生存率无显着性差异(P>0.05)。此外,第4 组和第5 / 6 组在总体存活率方面没有观察到差异。这些结果提示,IA期高危评分的患者可能与IB期和II期的低风险评分患者有相似的预后。建议对具有高风险评分的IA期患者
也应使用辅助化疗
。6组中,1组预后最好,6组预后最差。值得注意的是,在综合数据集中,IA阶段与IB阶段的总体生存期存在差异。
2.6 Relationship Between the Prognosis Signature and Disease-Free Survival
与低风险组相比,高危组非小细胞肺癌患者无病生存时间更短,更高的AUC代表着更好的表现。