学习笔记1:基础入门 初识BI

浏览: 1928
BI

前言:

在当今社会,大数据一词越来越被人们所熟知,”大数据时代“正悄然改变着我们的生活方式。而大数据也正在改变着企业运用商业智能的方式。商业智能(即BI)是帮助企业进行数据整合、提供解决方案的工具,在现代企业中被越来越广泛的使用。当然,作为一名本科生的笔者对此仍然十分陌生,恰逢寒假空闲与兴趣使然,笔者尝试从网络收集了一些关于商业智能的入门知识同时结合SMARTBI软件来学习一些相关的知识,并尝试将学习过程中整合的知识与学习经验在此与感兴趣的初学者一同分享。博文的内容可能存在较多的疏漏或者原创较少等的问题,笔者尽力完善的同时也恳请读者们不吝指教与多多包涵。

下面便进入第一篇:基础入门  初识BI


一、概念构建:

1BIBusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。

2、商务智能最初被定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。

3、商务智能的关键是从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供数据支持。

二、理解意义:BI的三个应用层次

1)低端层次(报表系统):

报表系统是将计算机技术与会计报表编制方法相结合设计出专门用于报表数据处理的软件,可分为EXCELWORD等编辑软件和数据库软件。报表是企业管理的基本措施和途径,是企业的基本业务要求,也是实施 BI 战略的基础。报表可以帮助企业访问、格式化数据,并把数据信息以可靠和安全的方式呈现给使用者。根据报表的绘制方式,报表工具大致可以分为SQL画布方式,Cell单元格方式和类excel方式。

2)中端层次(数据分析):

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析可以被分为描述性统计分析、探索性数据分析以及验证性数据分析。Excel作为常用的分析工具,可以实现基本的分析工作。

3)高端层次(数据挖掘):

数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

三、发展趋势:

商业智能具有美好的发展前景。企业将越来越不停留在事务处理过程而愈发注重有效利用企业的数据为准确和更快的决策提供支持,由此带动的对商业智能的需求将是巨大的。

BI的发展趋势大致可以概括为:

1)功能上具有可配置性、灵活性、可变化性;

2)解决方案更开放、可扩展、可按用户定制,在保证核心技术的同时,提供客户化的界面;

3)从单独的商业智能向嵌入式商业智能发展;

4)从传统功能向增强型功能转变;

5)从传统型BI向敏捷型BI转变(具体说明):

虽然传统BI厂商目前占据主流,但是也存在固有弊病:

传统BI有两种思路:一种是一体机,另一种是分布式数据仓库。这两种解决方案都大幅提升了BI应用的整体拥有成本,给企业带来了沉重的经济负担。传统BI解决方案中有N种产品,统一视图的重量建模过程动辄需要几个月甚至跨年的上线周期。有的用户没有用数据仓库做数据分析,而是继续使用Excel等其他工具做数据分析。而敏捷BI是基于细节数据,只需要一个产品就能实现N个视图的轻量建模,在上线周期和成本上都只有原来的四分之一。

但是敏捷BI并非要完全替换传统BI,而是希望能够优势互补,做到守正出奇。传统BI的经验成熟且产品稳定,有助于企业决策、洞察、监控整体业务状况,尤其是那些较少变化的宏观指标。而敏捷BI更有助于提升企业的洞察力和决策力,更简单易操作,可以让更多的人拥抱BI

四、应用案例:

1、沃尔玛经典营销案例:啤酒与尿布

    20世纪90年代,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入。

1993年美国学者Agrawal提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为。艾格拉沃从数学及计算机算法角度提出了商品关联关系的计算方法——Aprior算法。沃尔玛从上个世纪 90 年代尝试将 Aprior 算法引入到 POS机数据分析中,并获得了成功,于是产生了“啤酒与尿布”的故事。

2、数据挖掘帮助CredilogrosCía Financiera S.A.改善客户信用评分

Credilogros Cía Financiera S.A. 是阿根廷第五大信贷公司,资产估计价值为9570万美元,对于Credilogros而言,重要的是识别与潜在预先付款客户相关的潜在风险,以便将承担的风险最小化。

该公司的第一个目标是创建一个与公司核心系统和两家信用报告公司系统交互的决策引擎来处理信贷申请。同时,Credilogros还在寻找针对它所服务的低收入客户群体的自定义风险评分工具。除这些之外,其他需求还包括解决方案能在其35个分支办公地点和200多个相关的销售点中的任何一个实时操作,包括零售家电连锁店和手机销售公司。

最终Credilogros 选择了SPSS Inc.的数据挖掘软件PASWModeler,因为它能够灵活并轻松地整合到 Credilogros 的核心信息系统中。通过实现PASW ModelerCredilogros将用于处理信用数据和提供最终信用评分的时间缩短到了8秒以内。这使该组织能够迅速批准或拒绝信贷请求。该决策引擎还使 Credilogros 能够最小化每个客户必须提供的身份证明文档,在一些特殊情况下,只需提供一份身份证明即可批准信贷。此外,该系统还提供监控功能。Credilogros目前平均每月使用PASW Modeler处理35000份申请。仅在实现3个月后就帮助Credilogros 将贷款支付失职减少了20%

注:本文正文部分由整理百度百科词条、网络报道和其他电子资料而来,仅作学习笔记以供学习之用。


五、结语

经过本文粗浅简略的介绍,我们也算对BI有了最初步的认识。在了解了BI之于现代企业的重要性之后,激发了我对学习相关知识的兴趣。在接下来的时间里,我会循序渐进地学习基础知识并通过文章来展示我在学习过程中的收获与体会。

推荐 2
本文由 xjh_buaa 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

4 个评论

谢谢
条理真清晰,关注了
谢谢~
嘿嘿,不客气

要回复文章请先登录注册