很多用户在使用SPSS软件进行办公时会做一些简单的数据分析,他们都知道一件事情的结果往往不是由单个因素决定的,而是由多个复杂的指标决定的。今天,边肖将带大家一起研究用spss绘制数据的roc曲线!
操作方法:
一、分析预测
首先,准备好我们想要使用的数据,如图1所示,这是一组关于癌症患者和非癌症人群的指标数据。我们需要分析判断这些指标是否可以初步判断癌症发生的概率。
第一步:点击“分析”菜单中的“回归”,选择“二元Logistic”,利用性别、年龄、身体质量指数、吸烟和既往慢阻肺病史计算癌症概率。
在回归设置界面,将因变量设置为癌症,在块中添加除癌症以外的其他指标,最后在方法中选择“Forward: LR”方法,如图3所示。
在这组数据中,慢阻肺是一个多分类变量,而不是简单的两分类。我们用0到4来表示慢阻肺的程度,分别表示无、轻度、中度和重度。
因此,我们需要点击上面图3右侧的“分类”来定制分类变量。在分类协变量中选择慢阻肺,然后选择参考类别为“第一”,点击“继续”。
最后点击“保存”按钮(不确定按钮),然后勾选“预测值”中的“概率”,如图5所示。此时,SPSS将帮助我们生成每个记录的癌症预测概率值。
具体的预测值如图6所示。PRE_1是由SPSS自动生成的预测概率值。
二、绘制ROC曲线
有了预测概率结果,我们就可以用ROC曲线来分析这个预测结果的准确性。点击“分析”菜单,选择“分类”,点击“ROC曲线”,如图7所示。
选择SPSS生成的“PRE_1”作为测试变量,选择“cancer”作为下状态变量,然后将状态变量值设置为1。完成以上设置后点击“确定”,生成这两个预测指标和实际指标之间的ROC曲线。
最终结果如下图9所示。我们可以通过观察ROC曲线下的面积来判断预测的准确性。
以上就是用SPSS分析多指标下ROC曲线的全部教程。我们首先通过回归模型生成预测值,然后分析预测值和实际值之间的ROC曲线,得到我们想要的结论。