Tableau学习——维度和度量、离散和连续(一)

浏览: 5002

很多Tableau的初学者,经常容易混淆维度和度量、离散和连续各自的定义和关系。下面谈一些个人的理解,希望能起到抛砖引玉的作用。

首先要明确一点,维度和度量、离散和连续,是Tableau对数据源字段分类的两种方式,也就是说,可以按维度和度量对字段进行分类,也可以按离散和连续对字段进行分类。

那么什么时候做这个分类呢?当我们添加数据源后,Tableau读取具体的数据,就会根据数据的特征进行分类:

image.png

按照官方的说法:如果字段包含分类数据(比如产品名称、地区、订单日期),就划分为维度;如果字段包含定量数据(比如销售额、利润),就划分为度量。

很绕口,所以我个人理解是这样,分类数据通常是指文字、日期和无意义的数字,定量数据通常是指有意义的数字。

为什么这么说,具体看截图,维度字段,数据类型基本都是image.png字符型和image.png日期型,但是有个另类字段“行ID”,前面的#表示该字段类型为“数字(整数)”:

image.png

但是Tableau认为,该数字仅用于标识每一行,没有实际意义,因此会将其划分为维度。

度量字段,数据类型都是image.png,不论整数还是十进制的小数,并且每个值都是有实际意义,比如销售额是3.80元,数量是5个,利润是-0.25元,等等。


接下来,当我们选中一个维度字段并拖动到行或列功能区的时候,你会发现维度字段呈蓝色,表示离散:

image.png

而当我们选择一个度量字段并拖动到行或列功能区的时候,你会发现度量字段呈绿色,表示连续:

image.png

这时候的颜色,是另一种分类方式:离散和连续,在起作用。

那么离散和连续又是如何区分的呢?

首先,离散和连续来源于数学术语,官方的解释是:离散是指字段值各自分离且不同;连续是指字段值构成了一个不间断的整体。

有没有一种说了也白说,照样看不懂的赶脚?所以我的理解是,离散是指字段值之间没有什么直接关系,也无所谓先后顺序。比如地区,是先东北,再西北,还是先西北,再东北,无所谓,只要各不相同就行。而连续,是指字段值在一个区间之间是有连贯性的,先后顺序是有意义的,比如销售额,区间肯定是从0到一个最大值,要么按从小到大,要么按从大到小的顺序去观察数据。

有人一定会问,“行ID”呢?它也可以从小到大排列顺序呀!我是这么看的,从关系数据库角度出发,数据记录在数据表里的顺序,如果没有聚集索引,本质上是无序的,“行ID”仅仅起到唯一标识的作用,究竟从1开始,还是从10开始,还是从1000开始,都无所谓,只要在查询的时候确定有意义的排序就可以了。

推荐 1
本文由 gogodiy 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册