SPSS分析技术:古典多维尺度分析;用多维尺度分析画个中国地图

浏览: 3256

基础准备

前面详细介绍了多维尺度分析的理论基础,包括多维尺度分析的分析逻辑、应用场景、使用方法和作用等内容:

今天将介绍多维尺度分析最经典的入门模型:古典MDS模型。通过古典多维尺度模型的学习,可以让大家更加理解多维尺度分析的分析逻辑,在今后的运用中不至于与其它数据分析方法混淆。

古典MDS模型

多维尺度分析的逻辑可以用一句话描述:根据研究对象间的相似性或相异性矩阵,找到一个R维空间,用R维空间中的散点表示所有的研究对象,并保持研究对象之间的相似性或相异性关系。上一篇推送,我们用一个智力题来表述这个分析逻辑:事先告知四个地点之间的间隔距离,能否画出包含这四个地点相对位置的位置结构图?

古典多维尺度分析是最早出现的MDS方法。假设有n个研究对象,已知它们之间的相异性矩阵。古典多维尺度分析能够找到某个r维空间,空间中的n个点刚好能够表示n个研究对象,且这些点之间的距离非常接近于相异性矩阵:

image.png

古典多维尺度分析的作用就是找到一个r维空间,能够用空间中的点表示研究对象,并保持研究对象之间相异性的结构特征。


案例分析

现在有一份全国31个省级行政区的球面距离数据,包括4个直辖市(北京、天津、重庆和上海),5个自治区(新疆、西藏、宁夏、内蒙古和广西),距离数据整理成矩阵的形式。除此之外,还包括邮政编码、经度和纬度等变量信息。利用古典多维尺度分析,可以得到31个省会城市之间的位置结构图。

image.png

(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)


分析思路

因为31个省会城市之间的距离是连续型数据,可以代表省会城市渐渐的相异性水平,数据资料被整理成矩阵的形式,可以利用古典多维尺度模型处理数据,得到31个省会城市之间位置结构图。我们可以将位置结构图与实际的地图对比,看看是否相同。


分析步骤

1、选择菜单【分析】-【标度】-【多维标度(ALSCAL)】,将31个省会城市的变量选入变量框内。因为矩阵内的数据表示的就是省会城市之间的距离(相异性数据),所以选择数据为距离;点击【形状】按钮,本案例的距离矩阵为正方形矩阵,选择对称正方形。

image.png

2、点击【模型】,测量级别选择比率,条件性和标度模型保持默认选项的矩阵和欧式距离;点击【选项】按钮,将组图选中。

image.png

3、点击确定,输出结果。


结果解释

1、模型拟合结果;由于选择拟合输出二维空间,因此首先输出两维空间的迭代记录,从结果可知,只迭代1次,S-stress值的变化率(Improvement)就小于默认的0.001,达到收敛标准。接下来输出表示模型拟合效果的两个统计量Stress和RSQ。RSQ就是决定系数,表示数据总变异中能够被二维空间散点所解释的比例;Stress是依据克鲁斯卡尔(Kruskal)应力公式计算的结果。RSQ的值为0.99998,近乎于1,说明二维空间的散点能够很好地表示31个省会城市之间的距关系。Stress等于0.00216,是非常小的数值,Stress的评价标准为:Stress>=20%,近似程度差;Stress<=10%,近似结果满意;Stress<=5%,近似结果好;Stress<=2.5%,近似结果很好;Stress=0,完全匹配。可见31个省会城市球面距离的古典MDS模型的拟合效果非常好。

image.png

2、31个省会城市在拟合生成的二维空间中的坐标,这里只截图显示前10个省会城市坐标,大家可以自己操作得到完整坐标结果。

image.png

3、位置结果图;SPSS软件将我国31个城市按照实际距离计算出相应距离,然后在二维空间排列出来。将左边的位置结构图与右边的实际地图对比,看上去排列不完全相同,两者的差异在于坐标系统进行了旋转,但是各城市的相对位置都是吻合的。

image.png

4、线性拟合散点图;表示原始数据与用古典多维尺度模型计算出来的欧氏距离的关系,如果模型的拟合程度好,则所有散点应该在一条直线上。从下图可知,所有的散点基本处于一条直线,没有明显的离群点,因此模型的拟合效果非常好。

image.png

总结一下

由于这些距离都是通过经度和纬度计算出来的31个省会城市之间的真实二维空间距离,因此用古典多维尺度分析能够很容易的找到一个二维空间,用31个散点代表31个省会城市,这31个散点之间的欧式距离比例与真实距离比例是完全一致的。但是,如果进行多维尺度分析的变量不是真实变量而是抽象变量,希望用多维尺度分析找到合适的空间和散点表示抽象变量之间的空间关系,那么模型拟合的效果就不会这么好了。

所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。

温馨提示:

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

  • SPSS教学视频,添加草堂君微信(possitive)索取。

推荐 1
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册