ggplot2高阶案例应用——中国家庭金融资产配置变化

浏览: 2142

今天浏览新闻,看到一个关于美国居民家庭金融资产配置的调查,主要介绍1974年~2016年美国居民和非居民部门家庭金融资产配置比例分布演变的数据。

数据显示,在所统计的现金和活期存款、定期存款、养老基金、保险计划、共同基金和货币基金中。

1974年,一个典型公民把8%的金融资产放在现金和活期存款,35%放在定期存款,0.1%放在货币基金,3%放在共同基金,47%放在养老金。到2016年,这些数字演变为2.5%、22%,2.7%、31%和53%。

在这43年中,活期存款的比重降低了5.5%,银行存款的比重整体下降了8.5%,货币基金的比重超过了活期存款,共同基金和养老金合计增加了34%。

这是一个典型的时间点结构对比数据,我之前曾经用Excel做过一个类似场景的图表,今天使用R语言重新演示此案例。

以下过程我将使用上述案例数据演示制作此类带有连接带的堆积柱形图:

library("ggplot2")

library("showtext")

library("Cairo")

font_add("myfzhzh","方正正粗黑简体.TTF")

#原始数据:

mydata<-data.frame(

      Class=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),

      Y1974=c(8,35,0.1,3,47),

      Y2016=c(2.5,22,2.7,31,53)

)

mydata$Class<-factor(mydata$Class,levels=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),ordered=T)

以上这种案例图,中间的连接带与两侧的柱形图颜色系列是不同的,所以如果按照多边形去构造,需要分成两波来制作,第一波是含有数据信息的两个柱形图,第二波是中间的连接线,为了更好的设置间距,柱形图和中间的链接线都是用ggplot2函数中的geom_rect()图层进行构建。

geom_rect()的规则是根据每一个多边形的边界点进行形状构建,所有我们需要获取15个矩形块中不重复的24个坐标点。

根据以上思路,先构造两侧柱形图的数据源;

bar1<-data.frame(

         Class=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),

         xmin=rep(0,5),

         xmax=rep(5,5),

         ymin=c(0,cumsum(mydata$Y1974)[1:4]),

         ymax=cumsum(mydata$Y1974),

         Year="Y1974",

         )

bar2<-data.frame(

         Class=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),

         xmin=rep(25,5),

         xmax=rep(30,5),

         ymin=c(0,cumsum(mydata$Y2016)[1:4]),

         ymax=cumsum(mydata$Y2016),

         Year="Y2016"

         )

mydata1<-rbind(bar1,bar2)

mydata1$Class<-factor(mydata1$Class,levels=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),ordered=T)

构造标签:

mydata1$label_x=rep(c(2.5,27.5),each=5)

mydata1$label_y=mydata1$ymin+(mydata1$ymax-mydata1$ymin)/2

mydata1$value<-c(mydata$Y1974,mydata$Y2016)

构造中间的连接带数据源:

midrect<-data.frame(Class=mydata$Class)

midrect$id<-1:nrow(midrect)

midrect$ystart<-c(0,cumsum(mydata$Y2016[1:(nrow(mydata)-1)]))

midrect$yend<-cumsum(mydata$Y2016)

midrect$start<-bar1$ymin

midrect$end<-bar1$ymax

转置并构造中间的连接带单个多边形四角坐标点:

midrect_data<-data.frame(t(midrect[,c("start","end","yend","ystart")]),stringsAsFactors=FALSE)

names(midrect_data)<-midrect$Class

midrect_data$order<-1:4

将这些坐标点数据转成长数据:

midrect_data_final<-gather(midrect_data,Class,lat,-order)

midrect_data_final$long<-rep(c(5,5,25,25),5)

midrect_data_final$Class<-factor(midrect_data_final$Class,levels=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),ordered=T)

#绘图过程:

color<-c("#0579AD","#0899DA","#519F46","#A2D293","#C7C8CC")

CairoPNG(file="E:/微信公众号/公众号——数据小魔方/2017年9月/20170922/bump_bar.png",width=1200,height=900)

showtext.begin()

ggplot()+

geom_rect(data=mydata1,aes(xmin=xmin,xmax=xmax,ymin=ymin,ymax=ymax,fill=Class),colour="white")+

geom_text(data=mydata1,aes(x=label_x,y=label_y,label=paste(value,"%")),family="myfzhzh",size=5,colour="white")+

geom_text(data=NULL,aes(x=c(2.5,27.5),y=c(98,115),label=c(1974,2016)),size=10)+

geom_polygon(data=midrect_data_final,aes(x=long,y=lat,fill=Class),colour="white")+

ylim(0,115)+

guides(fill=guide_legend(title=NULL)) +

scale_fill_manual(values=color)+

labs(title="美国居民和非营利部门的金融资产分布与社会融资成本\n(1974年至2016年)",

    caption="备注:金融资产数据来自于美联储发布的美国国家资产负债表年报,贷款利率数据来自世界银行官网。"

    )+

theme_void(base_size=18,base_family="myfzhzh") %+replace%

theme(

legend.position=c(.25,.95),

legend.direction ="horizontal",

plot.title=element_text(size=35,hjust=0),

plot.caption=element_text(size=20,hjust=0),

plot.margin=margin(10,0,10,0,unit="pt"),

legend.text=element_text(size=20)

)

showtext.end()

dev.off()

在线课程请点击:https://edu.hellobi.com/course/195


推荐 1
本文由 杜雨 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册