数据小魔方

杜雨,EasyCharts团队成员,EasyCharts公众号及知乎专栏特约撰稿人。R语言中文社区专栏作者,微信公众号——“数据小魔方”创始人。兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。每天会为您推送Excel商务图表、R语言可视化及数据可视化精彩案例。 个人公众号:数据小魔方(微信ID:datamofang)

0
推荐
3677
阅读

rmarkdown+flexdashboard制作dashboard原型

R语言作为一门统计计算和数据可视化为核心特色的工具性语言,其在可视化领域或者说数据呈现方面有着非常成熟和系统的解决方案。这里所说的解决方案不仅是指R语言里面有诸多的图形语法系统(比如base系统、grid系统、lattic系统等),更重要的是它拥有(目前比较成熟的)系统级输出方案,你可以理解为如何在项目中从一而...

发表了文章 • 2018-08-15 10:49 • 0 条评论

0
推荐
3988
阅读

金融数据获取的api接口

最近苹果的股价一路疯长,继周四突破万亿美元市值后,周五盘中高点、收盘价双创新高。盘中高点达208.74美元,收盘价报207.99美元,上涨0.29%,创历史收盘新高,市值达10045.76亿美元。在全球经济体的GGP排行中,已经可以稳稳排进前20名,真正的富可敌国了。为了看下苹果自上市以来的股价变动情况,特地研究了下R和Python...

发表了文章 • 2018-08-14 15:15 • 0 条评论

1
推荐
4066
阅读

批量将本地gis数据导入postgis数据库

以前在处理gis数据的时候,都是直接导入本地shp素材、本地geojson素材,本地topojson素材,自从接触postgis数据之后,深感使用规范的存储系统来统一管理gis数据的好处,特别是数据量大了之后,优势便更加明显,你可以选择将很多需要做空间计算的步骤转移到Postgis数据库内进行计算,要知道Postgis提供的空间计算能力与R...

发表了文章 • 2018-08-09 15:23 • 0 条评论

2
推荐
2742
阅读

如何处理地图投影转换

最近学习地理信息可视化总是遇到投影的麻烦,包括前段时间输出两篇关于simple features的分享中,其中没有特别处理投影的问题,老司机一看就能看出其中存在的投影问题。空间数据可视化笔记——simple features空间对象基础空间数据可视化与simple future模型应用于是花时间详细研究了下关于投影究竟是怎么一回事,没想到还...

发表了文章 • 2018-08-03 13:48 • 0 条评论

1
推荐
6174
阅读

Python可视化笔记之folium交互地图

leftlet给R语言提供了很好用的交互式动态地图接口,其在Python中得API接口包名为folium(不知道包作者为何这样起名字,和leaflet已经扯不上关系了),可以满足我们平时常用的热力图、填充地图、路径图、散点标记等高频可视化场景。关于folium在热力图上的用法,可以参考这一篇分享:使用Python中的folium包创建热力密度...

发表了文章 • 2018-08-02 16:11 • 0 条评论

0
推荐
2009
阅读

机器学习笔记之K-means聚类

K-means聚类是聚类分析中比较基础的算法,属于典型的非监督学习算法。其定义为对未知标记的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据尽可能接近,类别间的数据相似度比较大。用于衡量距离的方法主要有曼哈顿距离、欧氏距离、切比雪夫距离,其中欧氏距离较为常用。算法原理如下:...

发表了文章 • 2018-07-03 16:05 • 0 条评论

0
推荐
1826
阅读

机器学习笔记之KNN分类

KNN分类器作为有监督学习中较为通俗易懂的分类算法,在各类分类任务中经常使用。KNN模型的核心思想很简单,即近朱者赤、近墨者黑,它通过将每一个测试集样本点与训练集中每一个样本之间测算欧氏距离,然后取欧氏距离最近的K个点(k是可以人为划定的近邻取舍个数,K的确定会影响算法结果),并统计这K个训练集样本点所属...

发表了文章 • 2018-07-02 16:56 • 0 条评论

0
推荐
2791
阅读

leaflet在线地图之热力密度图

杜雨,EasyCharts团队成员,R语言中文社区专栏作者兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。推荐课程:体系全面,最具调性!R语言可视化&商务图表实战课程​之前在练习leaflet的时候没有找到R语言leaflet中的热力密度...

发表了文章 • 2018-06-26 12:50 • 0 条评论

0
推荐
2473
阅读

构建自己的地理信息空间数据库及与客户端简单交互

最近研究了下postgresql数据库及其空间地理信息拓展插件——postgis。postgis作为新一代空间数据存储标准模型,将空间地理信息数据结构规范为关系型数据库可以承载的sp模式(simple features),这样,使得之前门槛颇高的gis空间数据存储模式变得通俗易懂、简单明了。最重要的只要接触过SQL语言,就可以利用postgis的SQL语...

发表了文章 • 2018-06-20 10:21 • 0 条评论

0
推荐
2534
阅读

Python数据可视化与basemap数据地图系列2——点线图

前一篇介绍了如何使用mpl_toolkits包中的basemap模块制作填充地图,这一节继续分享线图+点图的应用。案例一:1、导入依赖包:import pandas as pdimport numpy  as npimport matplotlib.pyplot as pltfrom mpl_toolkits.basemap import Basemap %matplotlib inline2、导入制作点线的数据源:province_city = pd.rea...

发表了文章 • 2018-05-31 10:17 • 0 条评论

1
推荐
2510
阅读

Python可视化与basemap数据地图系列1

前天最近在梳理Python中可以制作数据地图的可视化工具包,分别实践了geopandas、folium、Basemp,通过对比发现,静态地图中最为成熟的最终还得是Basemap工具,它是mpl_toolkits包中的一个专门用于构建地理信息数据可视化的扩展库。Basemap工具在地理信息读写、坐标映射、空间坐标转化与投影等方面做的要比geopandas更加成...

发表了文章 • 2018-05-28 10:46 • 0 条评论

1
推荐
1692
阅读

空间数据可视化与simple future模型应用

这是一篇关于关于空间地理信息数据可视化与simple feature 模型应用的笔记小结。之前关于simple feature地理信息数据模型的分享已经有两篇了,这里会继续分享simple feature模型在构建 Point/MutiPoint、LineString/MutiString、Polygon/MutiPolygons。Polygon/MutiPolygons的应用其实就是数据地图模型的新拓展,在R语言...

发表了文章 • 2018-05-22 11:43 • 0 条评论

0
推荐
2404
阅读

ggplot2都有哪些使用不多但是却异常强大的图层函数

要说ggplot2中那些使用不多但是却功能强大的图层函数,我首先想到的就是geom_rect、geom_linerange、geom_segment、geom_ploygon。这四个函数分别定义了ggplot2中的矩形图、垂直线图(线范围图)、线段图、几何多边形图。这四种图表类型独立使用的机会很少,一般都是作为图表的辅助信息,但是如果能恰到好处的使用,你会...

发表了文章 • 2018-05-21 18:06 • 1 条评论

0
推荐
2035
阅读

R语言数据分析笔记——Cohort 存留分析

相信经常做数据分析的同学都听说过Cohort 分析,特别是互联网运营中,用于分析客户存留等场景,以往这种分析大都借助SQL+Excel完成。最近在尝试学习 Cohort 用户存留分析时,找到了国外一个数据分析爱好者Cohort 存留分析的Python版本完整代码,并且很良心到的提供了练习数据,作为一个R比Python要熟练的菜鸟分析师,自...

发表了文章 • 2018-05-14 14:36 • 0 条评论

0
推荐
2557
阅读

R语言构建RFM模型了解一下~~~

RFM模型是市场营销和CRM客户管理中经常用到的探索性分析方法,透过模型深入挖掘客户行为背后的价值规律,进而更好地利用数据价值推动业务发展和客户管理。RFM是种客户行为的英文缩写:R:Recency —— 客户最近一次交易时间的间隔。R值越大,表示客户交易距今越久,反之则越近;F:Frequency—— 客户在最近一段时间内交易的...

发表了文章 • 2018-05-14 13:49 • 1 条评论