这篇有个主人公,咱就叫他小S吧,有一天想学习统计学,但是呢不了解统计学是干嘛的,说不清道不明的这种状态。所以小S只好去图书馆借大量的相关的书籍搞清楚统计是干嘛的呢?说道这里,做任何事情都要5w2h,如果凡事都能5w2h了,相信我,有一天大量的“他逻辑很清晰”这种相关的夸奖会落在你的头上。
先从5w2h上来讲:统计学在商务与经济中的应用
1:what:什么是统计学呢?打个比方吧,就是平时你看到那些进货的都会把数据记下来,比如进了多少,卖了多少,如果加上时间维度的话,就是这天卖了多少,那天卖了多少,各种数据记录的过程叫收集,收集完了你肯定会分析吧,去理解和解释吧,老板问你哪天卖的好,这时候就是 统计学的发挥了。
官方定义:统计学是搜集 分析 表述 和解释数据的科学与艺术,
可分为描述统计学与推断统计学。
说到这里,推断统计学可是笔者大大的热爱,太好奇了,当然作为同学的你看这篇文章一定也好奇,假设你学会了,那你自信心一定爆棚,可以泡妹子了。
比如说吧,你公司的美女都喜欢怎样的男生或者怎样的电影呢,你可以分别采访几个美女,采访的要点是几个指标,通过这些指标来推断总体(这里不严肃的讲的哈)
2:why:为什么要学统计呢?通过上边我们可以看出 如果做生意,如果想泡妞想摸清楚美女的偏好,这些通过汇总的数据分析能够更有效的帮我们做决策,至少更科学的决策。官方定义:能够帮助管理者和决策者更加准确的理解市场和经济环境,做出更加科学 准确的决策。
3:where:嗯学了这些用在哪里呢,相信作为读者的你之所以来看这学,就是因为媒体上整天轰炸大数据,结果听了这玩意不知不觉的就想了解大数据的基础了。
4:whoandwhen :当然就是现在的你了。
接下来就是统计学的基本概念了。小S觉得,下边这些概念基本上只要初中的学历就能读懂,想想就不给童鞋解释了,否则大家定会背后说小s的坏话。
数据:是描述和解释所搜集 分析和汇总的事实和数字。举个例子,昨天商场记录的各品类的销售记录 销售额 库存等
数据集:将用于特定研究而搜集的所有数据称为研究的数据集。举个例子,商场里记录的某一刻洗衣粉在过去7天的销售件数等都可以算做,目的是为了研究和星期的关系。
个体:是指搜集数据的实体。 变量:是个体中所感兴趣的那些特征。
观测值:对某一特定个体得到的测量值集合成为一个观测值。
搜到了这些数据后,我们需要分类,换一种说法要度量,在统计学这里分为:名义尺度,顺序尺度,间隔尺度,和比率尺度。
名义尺度 说白了就是个体的分类,比如前边说的洗衣粉,手工皂这些数据的本体的分类。
顺序尺度:数据具有名义数据的性质,并且数据的顺序或等级的意义明确,这种变量的测量就属于顺序尺度,比如你在上学时老师的评分标准,优秀 良好 及格,额不小心撂倒你的伤心处了哈哈。
间隔尺度:如果在前边的顺序基础上,还有一定的按固定的度量单来表示数值间的间隔的话那就是间隔尺度,比如说60分及格,80分就良好,中间差了20分当然这里不严谨
比率尺度:在间隔基础上,如果这2个数值之比是有意义的haunted那可以是比率尺度。
数据分 分类型和数量型数据。其中分类型是归属于某一类别的数据这个概念, 数量型数据是指使用数量表示大小或多少的数据
同理,分类变量是用分类型数据表示的变量 数量变量是用数量型数据表示的变量。
为了分析方便,对数据做了进一步区分,分别为截面数据和时间序列数据。
比如超市某一天,分别统计谁的好,这是截面数据,它是在相同或近似相同的同一时点上搜集的数据
如果要查看超市的卖的最好的在过去的几个阶段卖的怎样来分析趋势的话,这种的是时间序列数据,它是在几个时期内搜集的数据。