概率分布耳熟,什么是概率分布?

浏览: 2415

image.png

以下文章内容,来自草堂君的新书《人人都会数据分析-从生活实例学统计》。因为新书中增添和细化了很多知识点,所以草堂君会逐步将这些内容补充到统计基础导航页中来,帮助大家建立数据分析思维。限于篇幅,只截取书中部分内容

学会确定事件不同结果的概率以后,下一步就是研究各个结果的概率分布情况,从而能够在下一次面对同样的事件时,做到心中有底,决策有理。概率分布是指事件的不同结果对应的发生概率所构成的分布,可以利用二维坐标进行形象地解释。如下图所示,两幅图的横轴代表的都是事件所有可能结果的取值轴,纵轴则是不同结果所对应的发生概率或概率密度。

image.png

回顾数据的分类,根据数据连续性的不同,数据可以分为离散型数据和连续型数据。同样,事件发生结果的对应数据既可能是离散型数据,也可能是连续型数据。因此,事件结果所对应的概率分布因为结果对应数据的不同也被分为连续型概率分布和离散型概率分布。理解离散型数据和连续型数据是理解概率分布的重要基础,大家可以点击文章链接回顾:热炒的“数据”,你了解“它”吗?

如上图(左)所示,离散型概率分布是一条条垂直于X轴的垂线(也可以用矩形柱表示),每条垂线与X轴的交点代表事件可能的发生结果,垂线上端点对应的Y轴的值表示该结果发生的概率(区别于概率密度)。因此,离散型概率分布的概率函数被称为概率质量函数。离散型概率分布的种类有很多,比较常见的有二项分布、多项分布、超几何分布和泊松分布等。

如上图(右)所示,连续型概率分布的图形是一条连续的曲线,这是因为事件的发生结果可能是X轴上的任意一点。与离散型概率分布不同,连续型概率分布的Y轴表示事件结果对应的概率密度(区别于概率),这是因为X轴上如果取任意一点,它所对应的概率为0(想象一下,事件的可能结果可以是X轴的某一段上的任意一点,事件发生的概率被分得几乎为0)。只有在X轴上取一段区间,才能得到相应的事件发生概率,概率值等于曲线下的积分面积。对任何连续型概率分布,曲线下方的总面积都等于1(概率总和100%),连续型概率分布曲线对应的函数被称为概率密度函数,而积分面积对应的函数被称为概率累积函数。常用的连续型概率分布有指数分布、均匀分布和正态分布。

当然,概率分布图不仅有上面展示的二维图,还有三维图(两个事件结果取值轴,一个概率(密度)轴),多于三维的概率图是无法绘制的。不管是离散型概率分布,还是连续型概率分布,都是统计学家们长期数据积累、分析和总结的成果,这些耳熟的概率分布名称,都代表了一种数据分布规律,是能够被人们利用的规律。通过概率分布和概率分布图,可以帮助我们对事件可能发生的结果以及结果对应的发生概率或概率密度有清晰的认识。概率分布也是数据样本与数据总体的连接器,因此,只有对数据样本的概率分布了如指掌,才能通过数据样本对数据总体做出合理的推断。

下面几篇文章,我们会对各种概率分布的内容,形态和生活实际应用进行介绍。大家也可以直接从书籍《人人都会数据分析》阅读学习。

温馨提示:

  • 数据分析课程私人定制,一对一辅导,添加微信(possitive2)咨询!

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

推荐 0
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册