COX回归是临床常用的一种分析方法,多用于肿瘤、血液等疾病患者,其考虑到了临床随访删失情况,多用与生存分析。前面我们已经多次讲过使用SPSS、和R语言进行COX回归,今天继续来讲讲stata,它相对其他两个软件的优势是比R语言简单,可以界面操作,比SPSS在某方便功能强大一些。

首先我们打开stata导入数据,还是原来乳腺癌的数据,我们先来看看数据:

age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿瘤大小类别(分组变量),ln_yesno表示是否有淋巴结肿大,time是生存时间,后面的agec是我们自己设定的,不用管它。

r语言log() r语言logistic回归列线图_数据库


假定我们研究的是ln_yesno表示是否有淋巴结肿大对患者生存率的影响

我们先用K-M曲线做图比较一下,依红色箭头打开

r语言log() r语言logistic回归列线图_数据_02


先要进行时间和生存状态设置

r语言log() r语言logistic回归列线图_SPSS_03


r语言log() r语言logistic回归列线图_数据库_04


如下图显示就是设置好了,上面显示了一些生存和死亡患者的信息,最长生存时间是133个月

r语言log() r语言logistic回归列线图_SPSS_05


我们要看的是否有淋巴结肿大对患者生存率的影响,要在下面勾选分组不然做出来的是累积生存率

r语言log() r语言logistic回归列线图_数据库_06


最后点击确定

r语言log() r语言logistic回归列线图_r语言log()_07


这个只是单单考虑了淋巴结肿大的因素做出的分析图,在临床时机工作中,生存率还受到很多因素的影响,如年龄、淋巴结转移等等

我们还可以做一些调整,调整患者混杂因素

r语言log() r语言logistic回归列线图_类变量_08


结果和原来明显不一样了,调整了以后,淋巴结肿大的生存率明显要低

r语言log() r语言logistic回归列线图_数据库_09


图片还可以做很多修改,如加上风险表等,这里就不详细说了,大家可以自己研究一下,现在我们来说说怎么制作列线图

Stata制作列线图需要安装两个包,nomolog和nomocox,nomolog是用来制作Logistic回归列线图的,nomocox是用来制作COX回归列线图的

Nomolog的安装命令是:

ssc install nomolog或者

net from http://www.stata-journal.com/software

net cd sj15-2

net describe st0391

net install st039

nomocox的安装命令是
ssc install nomocox

你要是实在安装不了,也可以在这个地址下载
nomolog:

nomocox

下载好以后把两个包的文件拷贝在:

C:\ado\plus\n的目录下

r语言log() r语言logistic回归列线图_SPSS_10


如果你的目录只有C:\ado\plus,没有n的文件夹,你可以自己创建一个

拷贝好以后还要打入命令:

Nomolog:

window menu append item "stUserGraphics" "&Nomogram post logistic regression" "db nomolog"
window menu refresh

这样就在stata里形成了一个图标

r语言log() r语言logistic回归列线图_SPSS_11


Nomocox的命令是:

window menu append item "stUserGraphics" "&Nomogram post Cox regression" "db nomocox"
window menu refresh

OK,安装好列线图的插件以后我们来开始制作列线图,但是大家要明白,列线图只是COX回归的一个可视化分析,所以我们要先做COX回归,按红色箭头依次点击

r语言log() r语言logistic回归列线图_SPSS_12


其实和竞争风险模型差不多,也是在这里选入协变量,因为刚才结局变量和时间变量我们已经设置了,这里就不用再次设置了

r语言log() r语言logistic回归列线图_数据_13


点击确定得到下图

r语言log() r语言logistic回归列线图_r语言log()_14


大家注意一下,COX回归模型虽然出来了,但是没设置的情况下有些分类变量stata会它当连续变量,这样当然不对,我们要把分类变量标出来,就在它前面加一个i.

操作如下:先把stata的命令复制下来,命令是:stcox ln_yesno er pr age

r语言log() r语言logistic回归列线图_类变量_15


拷贝到命令框

r语言log() r语言logistic回归列线图_r语言log()_16


在分类变量前面i.,因此命令变成:stcox i.ln_yesno i.er i.pr age, 然后输入命令

r语言log() r语言logistic回归列线图_数据_17


最后得到的模型为

r语言log() r语言logistic回归列线图_r语言log()_18


在调整了其他协变量后,有淋巴结肿大的死亡风险高2.35倍

后面制作列线图就很简单了,但图上依次点击

r语言log() r语言logistic回归列线图_类变量_19


这是stata列线图的界面,点击红箭头的生存对话框

r语言log() r语言logistic回归列线图_数据_20


这里至少要设置一个参数,这里填入10

r语言log() r语言logistic回归列线图_类变量_21


这样最简单的列线图就制作好了

r语言log() r语言logistic回归列线图_类变量_22


还有很多功能和调整留给大家自己摸索了,说了这么多,其实操作很简单,感觉stata制作列线图比R简单多了。