SPSS分析技术:多重线性方差分析;自主创业不能盲目,你做好市场调研了吗?

浏览: 1686

基础准备

前面我们介绍了多重线性模型的分析基础:数据分析技术:多重线性模型;也难也不难的建模从这里开始吧!今天我们用一个简单的仅含有两个自变量的实际例子来阐述如何进行多重线性回归分析。

生活场景

我们国家的很多行业都没有完全实现完全市场化,例如,交通、油气、电力、烟草等等,在这些没有完全市场化或完全垄断经营的行业,经营数据并不是市场自由分配的体现。零售业因为它的入门门槛不高,销售品种多样,利润普遍轻薄等特点,是改革开放最早放开的行业,也是最能体现市场自由调配功能的行业。阿里巴巴的成功正好说明了这一点

2012年的双十二,王健林和马云进行了一场关于“电子商务能否取代传统实体销售”的亿元赌约。马云认为电子商务一定可以取代传统零售百货,而王健林则认为电子商务虽然发展迅速,但传统零售渠道也不会因此而死。四年多过去了,现实貌似在偏向王健林,因为互联网公司也纷纷在布局实体经济。京东甚至在今年计划开百万家线下实体店。


互联网知名企业都纷纷入局过去属于小生意人的行业,那么已经存在的很多小超市,便利店、士多店和夫妻老婆店是否就是死路一条呢?草堂君不会武断给出自己的答案,但是可以说一句时髦的废话:改变可能依旧死,不改变那是肯定死。我相信用数据分析来帮助制定生意策略是今后能够存活的小店家的必备技能之一,如果依旧靠天吃饭,不调研,不分析,那么将积蓄亏完,三月关店就是必然。看看现在街上三天两头换招牌的现象就不足为奇了。

案例分析

作为回归模型入门,我们先选择两个自变量的数据作为分析案例。国内某专注于县级城市的KTV连锁企业计划在国内的另外几个县级城市再开设几家分店,收集了目前已经开设的连锁店的销售数据,店铺所在城市的35岁以下人数和人均可支配收入数据。建立二元线性回归模型,对计划开设分店的销售额所预测。


(例题数据文件已经上传到QQ群,群号请见文章底部温馨提示)

我们按照多重线性回归分析的操作步骤进行分析。

第一步:制作散点图,观察两个自变量:人口数和人均可支配收入之间的相关关系。


左边的散点图是三维散点图,可以发现,销售收入、35周岁以下人口数和人均可支配收入的三维散点图是近似于线性关系的。用空间散点图(三维以上)的缺陷很明显,就是观察不易且变量数多于三个就无法使用了。右边是散点图矩阵,这是更为常用的观察变量之间关系的散点图形式,从图中可以知道,销售收入、35周岁以下人口和人均可支配收入的关系都存在较强的线性关系。


第二步:利用SPSS确定多重线性回归方程。

选择菜单【分析】-【回归】-【线性】,将销售收入选为因变量,将35周岁以下人口和人均可支配收入选为自变量。其它设置保持系统默认形式。点击确定,输出结果。


结果解释

1、输入/除去变量表格;


该表格显示的是参与的变量数量,因变量是销售收入,自变量有人均可支配收入和35周岁以下人口数量。自变量进入模型的方式为输入,也就是强制所有的自变量同时进入模型。关于模型进入的方式,我们将在后面详细介绍。

2、回归模型的评价表格;


R代表复相关系数,也称多元相关系数,表示所有自变量的整体与因变量的相关程度,取值范围在0~1之间,结果为0.958,代表人均可支配收入和35周岁以下人口数量这两个自变量总体与销售收入数据的线性相关程度是非常强的。该系数实际上是销售额实际值与回归方程计算得到的销售额估计值之间的皮尔森相关系数。

R方是复相关系数的平方,它表示回归模型引起的因变量变异占因变量总变异的比例。比例越大,说明回归模型越有效。需要注意,因为R和R方的是从变异的角度考虑多重线性回归模型的效用,所以引入的自变量个数越多,R和R方值都会增大,及时有些自变量对于模型来说是无意义和无效的。

调整后的R方,这个值可以用于含有不同自变量个数的回归模型的优劣比较,因为它是通过R方值除以自由度得到的,这解决了含有不同自变量个数的回归模型无法比较的问题。

标准估算的误差项表示残差的标准差,本案例中残差是销售额的实际值减去回归方程计算得到的估计值后的剩余值。该项的值越小,表示回归模型的效果越好。


3、整个回归方程的检验;


该检验是对整个回归方程的检验,检验的原理也很简单,就是比较由回归方程决定的变异方差与残差(总方差-回归方程决定的方差)的比值大小,如果由回归方程决定的变异方差显著的大于残差,那么说明回归方程是有效的。该多重线性回归方差的显著性p<0.01,说明得到的回归方程是有效的,也就是说得到的两个自变量的回归系数至少有一个是不等于0的。


4、回归系数及检验结果;


虽然回归模型的检验是通过的,但是对于每一个自变量是否有意义还需要对回归系数进行检验,从结果可知,35周岁以下人口和人均可支配收入这两个变量的回归系数都是有意义的,因为它们的显著性都小于0.05。对于常量,代表在35周岁以下人口和人均可支配收入这两个变量的取值都等于0的情况下,销售收入的值,在本案例中,这个常数是没有实际意义的,只起调节作用。


推荐 0
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册