可视化探索是数据挖掘的基本功

浏览: 1889

在大数据时代下,有人把数据比喻为蕴藏能量的地下石油。但你知道石油的平均采收率指标么?你知道你所拥有的数据,其中的“地质储量“有多大么?你知道自己的”挖掘“方法能够实现的”开采量“么?通过这个一个形象的指标类比,我们可以知道,大数据的“大”需要你去理解和探索,而得到“有用”价值,需要掌握合适的挖掘方法!

数据挖掘作为大数据分析的核心技术,是指从大量数据中揭示出隐含的、先前未知的、有潜在价值的信息的反复过程。它主要采用人工智能、机器学习、模式识别、统计学等技术,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。

“可视化探索”数据价值并不是一件很难的工作,很适合每个小白进入数据挖掘这个金领圈!但是通常会遇到的问题是,专门做可视化的软件(Tableau等),基本找不到能用的版本,而且都没有数据挖掘的算法;或者专门做数据挖掘的软件(SPSS等),有可视化和数据挖掘算法,但就是太丑了,不好操作;而SASRPython这些编程工具,学习和应用效率就更低了。最后锁定Smartbi(主要看到有免费版),下载安装很容易,尤其可视化部分用了百度Echarts,简直令人欣喜!

软件自带一些例子里的可视化效果,尤其“可视化探索”节点下有“交互视图”,可以在界面上随意选择X轴、Y轴和颜色字段,跟Tableau一样好操作。

1.png

专家诊病示例中的交互条形图(看见“动态重计算”没?)2.png

专家诊病模型中的网络图(用来看相关性也不错嘛)3.png

异常检测示例中的散点图(相关性很明显:有地就有钱?)4.png

异常检测示例中的直方图(阀值很明显)

5.png 6.png

媒体分级示例中的饼图(去掉最大的cluster2,重新分析占比) 

7.png

微博分析示例中的树状图(小白我看不懂,求解)

8.png

统计功能示例中的交互箱线图(以后可以分析股票喽)

9.png

文本挖掘示例中的词云(啥时候的数据,怎么大连这么火)10.png

微博分析示例中的账号转发关系(全是互相捧场的)11.png

时间序列示例中的线型图(应该是用来预测的吧)12.png

产品销售的地图分析(看到“值域漫游”了没?)

这个数据挖掘软件里的可视化功能不如Tableau里多,里面还有个叫“提升图”的,没看到示例,不知道是什么东西,但基本上能覆盖我的需求了。最需要赞的是,个人免费版本里,还有很多数据处理的功能,这样以后对Excel的处理,也能顺手搞定(虽然现在还看不懂每个的意思)。以及这么多还看不懂的东东(貌似很牛的样子)!

13.png14.png         

工具算是找到了,我可以继续坚持自己的 “大道至简”观点,不是把模型、算法一直挂在嘴边的才是牛人,能够用图形把问题说清楚的,才能站在沟通的制高点上,毕竟一图解千言,专业的分析报告不是人人能看懂的!

推荐 0
本文由 大麦 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册