1、聚类分析的描述





2、【分析】-【分类】-【k-平均值聚类】,进行相关参数的设置


3、结果显示:spss从中挑选了几个个例5个聚类中心选择了5个原始案例


4、针对存在的问题,进行相关参数的设置,增加迭代次数。。足够的迭代后,已经收敛,但还存在一个问题是:各聚类的效果不明显




5、主要是原始数据中差别有点大

6、所以要对数据进行标准化,得到标准化后的结果。



7、利用标准化后的数据进行聚类分析



8、结果看起来比较别扭



9、接着进行【分析】,【比较平均值】3395个样本中有443个1,2,3,4,5类各具有特点





10、结果



11、对变量做聚类分析



12、结果:第二张图中的横轴“25”对应“凝聚塥骈橄摆计划”表系数(距离)中的最大值233.297依次换算即可这个聚类结果不太合理----------------------换方法


13、换方法结果合理!



14、个案聚类,这个过程会自动处理缺失值,使得整体数据更加服从适用条件,也就是【两步聚类】



15、结果被 聚为两类


16、需要注意的事项:数据预处理:许多变量有强的共线性可以提取公因子,个别变量有共线性可以删除其中一个次要的变量,或者把它俩相加或平均组合成一个次要的。两步聚类可以自动处理异常值,把异常值单独归为一类。



17、其他方面

