如何在SPSS中做快速聚类分析?很多用户在使用spss数据分析软件时会遇到一些问题。最近有很多小伙伴问spss如何快速聚类分析。让我们在下面的小系列中向您解释一下。
操作方法:
一、方法概述
聚类分析是按照一定的标准对研究对象进行分类的方法。分类结果表明,每组中的对象具有很高的相似性,而每组中的对象具有很大的差异。
这种分析方法多用于对数据样本没有具体的分类依据时,IBM SPSS Statistics会通过观察数据为用户做出更完善的分类。
图1:功能位置快速聚类是聚类分析的一种,使用的函数是“分析”——“分类”中的“K- means聚类”。
二、案例分享
1.抽样资料
图2:样本数据我们这里选择的数据样本是一些学生在各个科目的最终成绩。利用快速聚类方法,可以分析不同学生成绩分布的差异和共性。
2.可变设置
图3:变量设置我们将单个科目的所有学生成绩作为分析变量,移动到“变量”窗口,将学生的数字变量移动到下方的“案例评分依据”窗口。
聚类数设置为分类数,需要根据数据样本的特点进行设置。这里我们把它分为四类。
有两种类型的聚类方法,即迭代和分类。前者比较复杂,在分析过程中会不断移动凝点,而后者总是使用初始凝点。我们选择第一种分析方法,这两种方法都有。
3.集群中心
图4:集群中心用户可以选择从外部文件或数据文件中写入或读取集群中心。在这种情况下,我们不使用这个函数。
4.迭代设置
图5:迭代设置我们可以设置迭代的终止条件,即达到设定的最大值后,我们将停止迭代分析,输出聚类分析结果。
收敛标准规定凝点变化的最大距离小于初始凝点的比例,如果小于设定值,则停止迭代,输出结果。
使用运行平均值意味着每次观察后都会重新计算凝点,这些设置可以默认保留。
5.救援
图6:保存新变量这用于设置保存形式。勾选“聚类成员”将保存SPSS的分类结果,勾选“距聚类中心的距离”将保存类别的观测值和欧氏距离,所以我们不做设置。
6.选择
图7:选项设置该对话框设置输出统计和缺案处理方式,选择“初始聚类中心”和“每个案例的聚类信息”。
7.结果输出
图8:在输出日志中可以看到聚类结果。这些学生根据他们在一门学科中的分数分为四类。SPSS输出几个表,包括初始聚类中心、迭代历史、聚类成员、最终聚类中心、最终聚类中心之间的距离以及每个聚类中的病例数,这些表完整详细,可靠性高。