数据分析面试之mysql的分组排序和变量赋值顺序

浏览: 1208

学习过mysql的同学,大都体会过mysql的一个的痛点,那就是mysql没有支持分组排序的开窗函数。但是我们能够通过使用变量来达到这个目的。

我们先来创建一个人员年龄表(如下),有个这样的需求是,根据不同性别进行分组排序他们的年龄,并得到序列号

CREATE TABLE person (id int, first_name varchar(20), age int, gender char(1));

INSERT INTO person VALUES (1'Bob'25'M');
INSERT INTO person VALUES (2'Jane'20'F');
INSERT INTO person VALUES (3'Jack'30'M');
INSERT INTO person VALUES (4'Bill'32'M');
INSERT INTO person VALUES (5'Nick'22'M');
INSERT INTO person VALUES (6'Kathy'18'F');
INSERT INTO person VALUES (7'Steve'36'M');
INSERT INTO person VALUES (8'Anne'25'F');

我们先来得到想要的结果,然后来和大家解释下

select 
    first_name,
    gender,
    age ,
    rank
from
    (select  
        first_name,
        gender,
        age,
        @rank:=if(@gen=gender,@rank+1,1rank,
        @gen:=gender
    from person,(select @rank:=0,@gen:=null) temp
    order by gender, age asc) b

结果如下:

RankRank一:mysql 变量解释

  • 通过set 赋值变量

    setset
  • 通过select 赋值变量

    selectselect

二:解释上面的分组排序代码

  • 第一步先赋值变量

VariablesVariables

  • 第二步使用IF条件进行分组

下面,我们不要太关注from person,(select @rank:=0,@gen:=null) temp,就是当作进行变量的初始化就好

   select  
        first_name,
        gender,
        age,
        @rank:=if(@gen=gender,@rank+1,1rank,
        @gen:=gender
    from person,(select @rank:=0,@gen:=null) temp
    order by gender, age asc

和大家说下这个代码的流程
a.第一步:变量赋值,是先运行from 后面的内容,以及排序,排序的目的是把 FM放到各自的组中(这一点和我们原来的先select 后order 是不一样的,等下会有说明)此时@rank等于0,@gen等于null
b.第二步: 开始进行select中的内容,会先进行
第一行,运行
@rank:=if(@gen=gender,@rank+1,1) rank,此时@gen是等于null的,而gender 是第一行的值,所以IF函数将会返回1,第一行的rank就会返回1,接着运行@gen:=gender ,此时的@gen会被赋值第一行的值
第二行,
还是先运行@rank:=if(@gen=gender,@rank+1,1) rank,此时的@gen是等于gender,根据IF会返回@rank+1 然后赋值到@rank,直到遇到下一个不一样的gender,@rank 才会重新变成1

三:变量赋值顺序

我们通过看个例子来感受下

set @rownum:=0;
select 
        first_name,
        gender,
        age, @rownum as rownum
from person
where @rownum<1
order by first_name,least(0,@rownum:=@rownum+1);

在sql 语句中的执行顺序是 from 、where 、select 、order by
在这我们的疑问是先进行的order by 后进行的 select

如果是先进行的select 的话,rownum会输出0、1,而真实的结果是
rownnum是输出的1、2

所以我们可以暂认为是先进行的order by 后进行的 select,因为没有找到官方的说明。

四:注意事项

mysql 的变量赋值有 =:=,这两种形式,但是在select 后面的赋值,要用:=这种形式,如果不用就会出现这样的问题。

image.pngimage.png

参考学习
mysql中变量赋值的顺序

推荐 0
本文由 DataFrog 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册