基础准备
将分析阶段的主要流程和使用工具用一个循环图来表示:
本篇介绍验证分析结果的两个工具:假设检验和方差分析。在统计基础中都详细介绍过它们的公式推导,应用和范例,下面主要介绍这两个工具在六西格玛分析阶段的应用。
假设检验
在统计基础中,系统介绍过假设检验,从假设检验理论基础到实际运用。对于这部分内容不知或遗忘者请前往统计基础导航页阅读相应文章回顾,有任何疑问请在文后提问,编者将尽快回复。
分析阶段假设检验的作用
利用头脑风暴法可以提出许多可能的原因,那么它们是否确实是影响关键质量特性的真正的原因呢?这就需要用数据进行验证。假设检验便是这样一种统计分析上具。譬如:
目前的工艺是否符合质量要求?
是否因为采用了某厂的原料使质量变差了?
不同的统计量(Z统计量、t统计量或F统计量等),假设检验的方法也不同。分析阶段运用得假设检验主要是对于正态均值的假设检验(t统计量)。
范例分析
用户反映某零件的一个指标近期不太稳定。由于近期更换了原料,那么是否因为更换了原料引起的?经分析零件的该指标服从正态分布,用户要求其均值为5,为了验证更换原料是否是引起指标不稳定的原因,从生产线上随机抽得9个零件,测得的指标值为:4.9、5.1、4.6、5、5.1、4.7、4.4、4.7、4.6。那么新工艺是否满足用户的要求呢?
1、提出假设;
这里质量特性y服从正态分布,如果新原料满足用户要求,那么零件的均值为5;如果不满足用户要求,那么零件的均值不等于5。这就是关于均值的两个命题,在假设检验中把它们称为“假设”,前一个称为原假设,后一个称为备择假设。记为:
如果原假设为真就认为更换原料不是一个关键原因,如果原假设不真就认为更换原料是一个关键原因,假设检验就是要判断原假设是否为真,当原假设不真时,就接收备择假设。
2、选择检验统计量
如上图所示,在统计基础系列文章中介绍过,总体标准差未知,对样本均值的假设检验需要用到t统计量,t统计量的计算式如下:
3、给定显著性水平,确定临界值
显著性水平:常用的显著性水平有0.1、0.05和0.01,它们对应的置信水平就是90%、95%和99%。查t分布表,获得对应的临界值。当然,根据单侧检验和双侧检验的区别,同样的显著性水平,对应的t临界值也是不一样的。在上面例题中,是双侧检验。
4、根据样本计算t值,得出结论
根据样本和t统计量计算公式,得到的t值,将它与查表得到的t临界值对比,得到结论:
方差分析
方差分析也是一种假设检验方法。它适用于多组数据的比较。譬如某种产品的原料来自三个不同的工厂,利用头脑风暴法时,有人提出产品质量不稳定的可能的原因之一是原料来源不同,那么这是否确实是质量不稳定的原因呢?为此需要对来自每一工厂的原料生产的产品测试其性能,收集数据加以验证。现在有三个工厂的原料,那么就可以收集三组数据。若假定每组数据来自正态总体,且每一总体的方差相等,各数据是独立收集的,那么我们需要比较的便是各个总体的均值是否相等。若他们的均值之间没有显著差异,那么这就不是主要原因,否则这是一个主要原因。检验这一问题的统计方法可以采用方差分析方法。用统计的语言来讲,方差分析是检验多个具有同方差的正态总体均值是否一致的一种统计分析方法。
范例分析
某厂生产中需要使用的一种零件可以由甲、乙、丙二个工厂提供,零件的强度对本厂产品质量是有影响的。为了了解不同工厂的零件的强度有无明显的差异,现分别从每一个工厂随机抽取四个零件测定其强度,数据如下表所示,试问三个工厂的零件强度是否相同?该例题的计算过程不表,大家可以参考下面文章,自己动手试算:
方差分析:单因素方差分析
Excel数据分析工具:单因素方差分析
第一篇文章为方差分析的理论介绍,第二篇文章为用Excel进行方差分析。
有效学习应该是一项系统工程,“生活统计学”将发布过的文章系统汇总,制成导航页,放置于平台首页下方的不同栏目中,能够极大的方便读者的获取与系统阅读: