数据可视化创造人与数据“零距离”

浏览: 1307

       商业智能(BI)一直无可非议的被看成IT的一部分。商业智能工具也是应用平台上的一个分支。如果我们把商业智能工具进行一定的罗列,大致把它们分为两个阵营:传统商业智能以技术为中心,以报表为主导的商业智能应用系统;新型的商业智能以用户为中心,高度互动,数据分析和探索为一体。商业智能过程中数据的采集、清洗、转换、维度存储、报表加工展现都是不可或缺的环节。而在数据的互动和展现上,传统商业智能固有的缺陷也是一个不争的事实。当然,很多商业智能工具厂家也正在朝着这个方向努力,并且几乎所有的商业智能工具厂家都推出了数据可视化、数据仪表盘(Dashboard),和数据分析工具。新型的商业智能厂家往往是在用户界面上发展迅速,但在后端数据处理上偏弱。

       数据的可视化在当前商业智能领域是一个大的趋势,越来越多的数据可视化技术、数据可视化分析功能在BI工具中被集成。不知不觉中,数据可视化已经遍布我们生活的每一个角落,毕竟普通用户往往更关心数据结果的展示(多维度经营分析、全视角决策支持等)。数据可视化可以使数据变得更有意义,而且可视化也可以使数据变得更容易理解。数据可视化软件也正在帮助越来越多的企业从浩如烟海的复杂数据中理出头绪,化繁为简,将海量数据变成看得见的知识和财富,从而实现更高效准确的决策过程。

       很多企业在自己的ODS系统、EDW系统、ECRM等众多系统上部署了数据分析类的应用之后,面对海量数据,难以分析,难以清晰的呈现,很难从中发现问题,企业管理者也很难从中找到决策之道。数据可视化工具能够以一种简便易用的方式将复杂的数据呈现出来,用户更容易理解这些数据,也就更容易做出决策。传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。

       近年来,伴随着云计算和大数据时代的来临,数据可视化产品已经不再满足于使用传统的BI工具来在数据仓库等系统中的基础上进行数据加工、处理、展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。当前Tableau、Qlik、Microsoft、SAS、IBM等IT厂商纷纷加入数据可视化的阵营,在降低数据分析门槛的同时,为分析结果提供更炫的展现方式。

      商业智能和数据分析平台成为大数据部署中的关键环节,而数据挖掘是实施商业智能的重要手段。然而,获取海量数据中的知识和价值的难点并不在于数据分析应用的部署,而在于专业数据分析人才的缺乏。“让每个人都成为数据分析师”是大数据时代赋予的要求,数据可视化工具的纷纷涌现,恰恰从一个侧面缓解了专业数据分析人才的缺乏程度。为了进一步让大家了解如何选择适合的数据可视化产品,本文将围绕这一主题,希望能对正在选型中的企业有所帮助,在大数据时代,数据可视化工具应该要满足以下几个特性。

(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,快速的收集分析数据、并对数据信息进行实时更新;

(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,并且能满足互联网时代信息多变的特点;

(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;

(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

1 数据可视化技术概述

      数据可视化是一个既包含科学可视化,又包含信息可视化的新概念。它是可视化技术在非空间数据上新的应用,使人们不再局限于通过关系型数据表来观察和分析数据信息,还能以更直观的方式看到数据及数据之间的结构关系。在目前提供数据可视化产品和服务的供应商中,SAP、IBM和SAS占据前三位,流行度比较,所占比例分别为19%、18%和17%;从领导者来看,Tableau以40%的优势遥遥领先。图1为 QlikView商业智能仪表盘-Dashboard;图2为Tableau对超市客户的分析示例;图3 为Tableau对销售情况的假设分析示例。QlikView和Tableau提供的数据可视化功能包含:商业智能仪表盘(Dashboard)、多维分析、客户统计分析、产品分析、交叉销售分析、绩效分析、业务报表、趋势和预测分析、假设分析等。

    1.jpg

                                                                                            图1 QlikView商业智能仪表盘-Dashboard

 2.png

                                                                                              图2 Tableau对超市客户的分析示例

 3.png

                                                                                        图3 Tableau对销售情况的假设分析示例

      数据可视化的思想是将数据库中每一个数据项作为单个图元元素,通过抽取的数据集构成数据图像,同时将数据的各个属性值加以组合,并以多维数据的形式通过图表、二维、三维等方式用以展现数据之间的关联信息,使用户能从不同的维度以及不同的组合中对数据进行观察,从而对数据进行更深入的分析和挖掘。图4 为Qlik view的“Shoe Finder”数据分析及挖掘示例。

 4.png

图4  Qlik view的“Shoe Finder”数据分析及挖掘示例

2 主流数据可视化工具介绍

2.1  Tableau Desktop

      Tableau Desktop是Tableau公司开发的桌面系统中最简单的商业智能工具软件,Tableau控制台灵活,具有高度的动态性,可完全自定义配置不仅能够监测信息,而且还提供完整的分析能力。Tableau将数据运算与美观的图表完美地嫁接在一起。用户通过拖放将所有的数据展示到数字“画布”上,转眼间就能创建好各种图表。使得界面上的数据越容易操控,决策者对自己所在业务领域里的所作所为就能有更透彻和清晰的把握。Tableau Desktop数据来源有多种方式,能同时支持Excel、支持各种数据库类型,同时能以web模式发布至网络中,以供他人访问。

      Tableau Desktop有多种展现形式,操作人员能够自定义图表类型,并以多种图形的方式进行展现,同时根据图形的不同,针对不同的展示图形有不同的提示。当用户从Tableau Desktop完成图形的绘制后,数据会从数据库中进行自动更新,从而对展示的数据进行自动同步,同时Tableau Desktop中集成了趋势分析,能对数据未来的走向进行一定的趋势分析,同时Tableau Desktop也与地理信息等进行了较好集成。在Tableau Desktop使用中发现,使用该软件操作反应较慢,由于该软件将数据全部加载至内存,因此对计算机的内存等使用要求较高。同时Tableau Desktop的趋势分析模块中,用户无法根据自己的需求选择算法,用户从而无法根据自己的商业特性对未来进行一个预测。图5 为Tableau 简单销售趋势预测示例。

 5.png

                                                                                             图5 Tableau 简单销售趋势预测示例

2.2  Qlik View

      Qlik view具备完整的BI架构,集成了ETL、OLAP、报表为一体的BI工具。Qlik view可以采集大多数据源系统,颠覆了传统BI基于数据集市才能实施的弊病,可以直接挂接业务系统,采集业务数据并进行多维度分析。开发和使用简单,自助数据分析和信息灵活直观的展现。Qlik view是完全基于内存的BI商业分析软件,分析数据存储在内存中,实时返回速度较快(400万条/秒)使开发者和分析者能够构建和部署强大的分析应用。集成了报表、监控、和仪表盘分析等独特的AQL构架,能够快速分布。不需要特定的硬件基础设施,任何地方都可以共享,不需要数据仓库和OLAP。简单地解决复杂的商业问题。

      作为一个相对完整的商业分析软件,使开发者和分析者能够构建和部署强大的分析应用。使各种各样的终端用户以一个高度可视化,功能强大和创造性的方式,互动分析重要业务信息。QlikView把商业分析需要的三个因素(Overview,Zoom&Filter,Detail-on-demand)放在一个独立软件包里。

QlikView提供了灵活、强大的分析能力,AQL构架改变了需要OLAP立方体的需求,也不一定要使用数据库,是一个可升级的解决方案,完全利用了基础硬件平台,来用上亿的数据记录进行业务分析。QlikView界面的对象可以以任意的方式组合,界面中维度设计为列表框,可以任意组合,采用自动关联技术,维度或者过滤约束条件变换时所有关联的数据都立刻改变,还支持搜索框的数据搜索、文本数据文件的及时刷新等功能, 如图6所示。

  6.png

                                                                                      图6 QlikView 销售及利润对比分析(维度灵活组合)

2.3  SAS

     作为SAS高性能分析方案家族中最新一款产品,SAS可视化分析拥有内存分析的卓越速度、自助服务功能和高度可视化的界面可为企业提供快速、简单而经济有效的商业洞察,并进行更好的商业决策。SAS可视化分析(VA)具有强大的数据探索和显示能力,它不是一个简单的商业智能产品,而是一个将商业智能和分析能力充分结合,并且快速、易用的产品。我们正处于各项技术涌现急需整合的时期,SAS可视化分析适用范畴广,无论是小型工作组、中小型公司还是超大型企业均可从使用中受益。

      SAS可视化分析的扩展性让各企业可以实现量身定制的数据可视化,或者按照实际需求逐步增加分析功能。其自助服务功能让非数据专家也可以轻松、有效地理解和分析大数据,在自己的数据中找到对业务问题的答案。同时可将企业内部IT部门从不断增加的数据集、临时分析和一次性报表请求中解放出来,把更多精力用于其他项目,更为高效。

      SAS可视化分析的设计初衷是为解决大数据分析问题,可以低成本地利用行业标准刀片式服务器的扩展性,以及适用于EMC Greenplum和Teradata的数据库系统。目前其根据数据量大小,可应用于不同部门。除了支持各部门硬件平台之外,SAS可视化分析还可添加图形显示选项和特色分析功能,包括预测、多元回归模型选项,多重视觉互动,动态过滤等更多其它功能。SAS可视化分析的高性能内存分析架构能够快速的完成不同规模的数据分析,让用户能够快速检查所有数据,消除了传统的由IT生成报告的等待时间,几分钟或几秒时间内可以在数十亿行数据中执行分析计算,和呈现可视结果。

2.4  SPSS

      SPSS最突出的特点就是操作界面极为友好,输出结果简介美观。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。

SPSS采用类似Excel表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。

SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS输出结果虽然美观,但是很难与一般办公软件如Office或是WPS2000直接兼容,而且SPSS作为三大综合性统计软件之一,其统计分析功能与另外两个软件即SAS和BMDP相比仍有一定欠缺。

2.5  总结与评价

·从产品的使用功能来看:Tableau 产品应用最丰富,能通过简便的拖拽来实现数据可视化,且能支持GIS地理信息、多数据来源等功能。

·从专业性角度来看:SPSS 能通过各种算法及软件包来对业务数据进行很好的预判展示,能与其他算法进行良好的集成,其产品的BI程度最高。

·在支持web及产品协作方面:SAS分布式存储以及多用户检索功能来搜索共享文件,通过共享的文件,不同用户能协同完成一个共同的任务。其余产品均支持进行web模式的发布;

·从性能角度考虑:Qlikviw通过AQL构架提供灵活、强大的分析能力时,AQL构架改变了需要OLAP立方体的需求。通过将用户数据转换成自己的格式,从而拥有快速,灵活的分析性能。

3 结束语

      总的来说,在数据可视化产品分类中,免费的开源产品一般使用起来没有限制,但应用门槛高、学习成本高,适合有一定技术实力的企业;免费的商业化产品一般是数据可视化厂商提供的免费版本,功能和应用上会有一些限制,适合数据量不大、对分析要求不高的中小企业;而收费的商业化产品往往需要大量资金支持,但部署和应用简便、服务有保障,适合有资金实力雄厚的企业。

      当然,数据可视化产品的选择还需要每个企业根据自己的情况“具体问题具体分析”,找出适合自己的解决方案。企业在选择和部署商业智能和分析平台的软件时,不妨考虑一下数据可视化产品,让数据与业务人员之间、数据价值和企业之间真正实现“零距离”。

推荐 0
本文由 yangjinyu 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册