跟小S学统计:描述统计学

浏览: 1602

今天是小S入门的第二天了,经过一天的工作洗礼后,终于屁颠屁颠的下班了,拥抱那美好的统计学梦想去了。

言归正常,话说昨天介绍了统计学的入门基础和基本概念后,小S私下反馈进度太慢太慢了,我要一下子学会降龙十八掌,作为为师,十分佩服小S的雄心,只好回了一大耳括子....咳.....咳 废话太多了,调整电影镜头中....

前边我们讲过,由于工作中统计的方便,所以数据分为:

分类型是用标记来识别项目的类型。比如彩球的颜色分类。

数量型就类似平时的表达多少或者大小的数值,比如几个红色的球几个蓝色的等。

小S平时喜欢思考,比如说在超市中购物,有时候会特别好奇在这些卖软饮料这些品牌当中,哪种是最受欢迎的呢?这个问题咱可以用"频数分布"这个角度来分析,所谓频数分布是指一种数据的表格汇总,表示在几个互不重叠的组别中的每一组的项目个数(即频数)。比如卖软饮料的,可以采用个简单的方法,如果不怕苦的话可以采用人海战术,盯在旁边,每次客户拿什么品牌的就记录下来,样本可以采用50次,假设结果出现19个可口可乐,百事可乐18次,汇源果汁10次,康师傅3次,整理表格如下

Clipboard Image.png

此图专业好听的话叫频数分布,可以从分布上能看出每个个体的分布形状,就像生物学上经常见到的某种介绍,狮子活跃在哪里,黑卷尾生活在哪里等若干若干,有助于大体认识,比如你想捕捉黑卷尾,通过分布就能提高遇到的概率哈哈。

频数分布:能表明在几个互不重叠的组别中每一组的项目个数(即频数)。但是通过上图也看到,通过绝对数的介绍人是没有感觉的,或者数大了感觉差不离,没啥影响似的,所以要换算成比例或者百分比更有趣。接下来2个概念,

相对频数分布:各组相对频数数据的表格汇总。公式是:组的相对频数=组频数/n  百分比频数=组的相对频数*100%

Clipboard Image.png

在生活中有时候我们得到了好几个样本数据,全是数据值的,对于这种数据型数据确定频数分布的步骤如下:

  1. 确定互不重叠的组数。(一般来讲都是采用经验的多些,比如你平时注意电话一定会发现大多5 10等多些整数类的,根据数据项来定)
  2. 确定每组的组宽,可以采用经验公式  近似组宽=(最大数据值-最小数据值)/组数
  3. 确定组限

累计频数:表示小于或等于每一个组上组限的数据项个数

价值总结一个频数分布的价值就在于它提供了对数据的深刻理解,而直接观察原始的数据,是看不出什么来的,这就是价值所在。

接下来简单介绍描述统计学的其它图表法(求放过,这种的知识咱百度好么)

  1. 条形图
  2. 饼图
  3. 直方图
  4. 打点图
  5. 茎叶图
  6. 散点图:说说这个,生活中作用大的很,一般是关于2个变量之间的关系的图形表述,比如说一个男的与一个女的关系是怎样的呢,要是正常来讲,大家都会说关系挺好 关系不一般,这种都是文字上的总会有那么缺憾,如果把它量化,那就简单了,比如一天的互动次数,按时间来分解,如果很明显的直线关系,那可以判断这2人关系不一般哼哼(这里不严谨)。我们举个商业类的,比如销售额与广告的关系,这种就发挥作用了,到底有没有效果可以一定程度上来通过散点图分析。注意,这里散点图是判断的是相关关系而不是因果关系。通过一个例子来看(x轴是广告次数,Y轴是销售额(100美元)

Clipboard Image.png

像本图描述的就是正相关关系,表明了广告次数和销售额直接存在正相关关系。但是所有的点并没有在一条线上,所以这种关系是不完全的。然而,这些带你的分布模式和趋势线表明,整体关系是正相关的。

反过来:

Clipboard Image.png

像本图表明:广告次数和销售额之间存在负相关次数。较高的销售额和较高的广告次数没有产生联系,反而加速了销售额下滑,(这里不讲广告和实际产品出现某种意外,比如不匹配或者引发了质量事件等,再者实际这种情况 很少,这里只是为举例负相关),这种图就是负相关,即随的X增加,Y趋向减少。

不思不觉45分钟过去了,这节课收获满满,瞧了瞧QQ信息等,小S深深的感受到了充分利用时间不闲玩,专注学习的魅力,他相信,随的时间的演化,他会加速实现想要的生活。接下来看了看明日统计学的预告

  1. 位置的度量
  2. 变异的度量
  3. 两关系间的度量

话说讲到这里,摆擂台,抛绣球,小S累个半死,预知小S累成啥样了,静待明日分解。

推荐 4
本文由 求知不才 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

4 个评论

效率很高呀
安排1个半小时就完成的
加油加油
非常不错啊

要回复文章请先登录注册