【Friday BI Fly】2016年06月17日 从产品角度用Excel 微信直播文字记录 【全程回放】

浏览: 1987

公告

周五BI飞起来,每周一个主题,一场跟数据有关的行业、工具、技术的交流盛宴,锁定在每周五晚20:30,不见不散!

本期微信直播主题:从产品角度用Excel

Clipboard Image.png

预告一下未来几期的微信直播活动分享主题将包括谈谈BI在生产企业的应用、大数据职位,数据场技能、数据科学家应用 、SPSS数据挖掘、腾讯大数据分析与挖掘应用、R语言实战、数据挖掘经典案例赏析等,具体日期安排请关注天善智能问答社区活动版块https://www.hellobi.com/events


主持人:加入本群的同学们,感谢大家参加由天善智能举办的 Friday BI Fly 活动,每周五微信直播,每周一个话题敬请关注。

【群规】本群为商业智能和大数据行业、技术、工具的交流学习群。不准发广告,只能发红包,发广告者一律移除微信群。


本次微信直播讨论内容

1.Excel的产品本质是什么

2.EXCEL是如何运作的

3.EXCEL里的树形结构、单元格的秘密等 

本期嘉宾介绍

尾巴

天善智能社区专家,专栏作者    

尾巴说数博客专栏: https://ask.hellobi.com/blog/weibaar

个人公众号:尾巴说数(weibashuoshu)

主持人:大家好,我是微信直播活动的主持人咖啡,每周一个主题,一场跟数据有关的行业、工具、技术的交流盛宴。我们的口号是“Friday BI Fly  周五BI飞起来”。

现在市面上的数据分析工具很多,常见的有SPSS、SAS、matlab等等,还有很多我不知道的,有些数据分析刚入门的朋友们就会疑惑,到底学哪个工具好呢,其实工具都是次要的,熟悉业务,有数据分析思维才是重要的,只要具备了这两个前提条件,哪怕用Excel来分析也是非常有价值的,何况Excel的功能也是非常强大的呢,下面我们就有请尾巴来给大家带来深度的Excel分享,有请!

从产品角度用Excel

Hello各位好,我叫尾巴,感谢天善智能,今天很荣幸在这里分享从产品角度学excel的一些事情。

刚刚看到有朋友说文字讲操作不如视频方便,实际上,今天并不会有太多操作上的东西。更多的就是随便聊聊excel的一些事情。

各位可以看到今天有放出一些内容,这些其实我已经在网上有写出来了,一直在有一搭没一搭的连载着。你们可以在天善的博客里找到这个系列的文字,或者去公众号【尾巴说数】里搜到全系列。

简单说一下这个系列的主旨。从产品角度看excel,其实本质就是说,把excel看作是一个产品来进行学习,去理解它的数据存储结构,从而明白什么该做什么

不过既然是分享,那必须得是一些新的东西。因此我在这里想脱离一下大纲,先聊一下当时为什么会构思出这个系列的缘由,以及从excel过渡到数据分析的一些经验。

首先我想讲的是,为什么当时决定连载从产品角度学excel这系列的文章。

我个人的背景是,12-14年中旬以excel为主要的数据报表工具和分析工具。后来因为要处理的数据量太大,厌倦了各种加班和重复性的工作,在14年中下旬开始接触access、sas和R语言,并渐渐在工作中使用R和数据库作为数据处理的工具,做更加自动化的报表,还有做更多维度的分析和挖掘。

跟很多人想象的不一样,我并不是一个纯粹的用excel的人。在这个转换的过程中,曾经有很长的一段时间,我是特别想放弃excel的。但是往往因为技术不过关,或者同事的需要,我还是要老老实实回到excel去做表,搞数据可视化,写分析报告等等等等。而且即使我日常很少用excel,我的同事也总是拿excel问题来问题,很多问题大同小异,常常在文本、数值、身份证号码不对了、纯数字ID变丑了报表崩溃了等等问题上纠缠不清。

我想放弃了很长时间,却最终还是没法放弃。

这时候我就有了一个疑问,为什么,为什么excel总是那么阴魂不散?到底excel有什么好,在有那么多数据工具的前提下,它还是能蓬勃生长?

以及,我还有一个麻烦,就是要找到一个正确教人用excel的方法,要避免小伙伴在同一个类型的问题里反复踩坑,也要让他们看得透excel书。

这两个疑问交叉在一起,最终衍生出的,就是“从产品角度学excel”这系列的立题。

立题诞生于一堆问题里

这个立题其实诞生的很偶然。

我难得的一次被朋友邀请出去教她学excel,我啥也没准备,习惯性第一千零一次打开《让excel飞》那本书,要给她串讲。

然后我第一次按照单元格是什么、单元格的文本和数字是怎么一回事,行与列有啥区别,以及透视表等等很顺畅的串讲结束了。那朋友理解的竟然还挺好接受。当时我就觉得,哎,我竟然能讲的那么顺畅,以后就那么讲算了。

这个是这个立意产生的一个先期结构:从单元格可以做什么开始,讲到单元格组成的列,再到行,知道透视表,再到数据报表。

然而这个并没有激发我把它写成一个系列的决心。这市面上有太多的excel教程了。有这个框架最大的好处是,我可以告诉别人说,学excel,从哪里开始,理解到什么程度,再到哪里结束。这个与市面上大多数的教程,并没有什么不同

直到有一天,在我开始补《大话数据结构》那本书时,看着看着,脑子里突然想到了excel的单元格,然后有一个问题突然产生,继续产生了一连串的问题:

有那么多数据结构,像菜单的后退前进据说用“栈”来实现,那么,excel是用什么数据结构来存储数据的呢,excel的单元格是用啥实现的呢,为啥它也分数字和文本,其他的数字样式,像日期什么的,是干啥干啥用的呢?为什么单元格不能自由移动,为什么图表可以自由动来动去?难道它也分层吗?excel最初是怎样设计和开发出来的?

blablablabla

这一连串的问题接踵而来,我发现自己竟然没几个能回答的上来。之前我抛弃我嫌弃我不想用的excel,此刻如此陌生。

而且我发现,如果往这个方向去研究excel,似乎很好玩,也很有逻辑,而且似乎还能解答我之前的两个疑问:怎样才能教人学好excel,以及excel到底有多好,才能永远在工作里阴魂不散??

综上,这就是我偶然一次脑洞开始,带着问题来写这系列excel文章的原因。

当然,营销点的考虑就是,这东西真的没人写啊,写excel教程的人好像平时就只用excel了,貌似没有搞编程的人去写excel教程了,这里有块市场空白区啊,这里有个可以跨界的地方啊,我先占用了来骗点粉吧——这些略功利的东西大家当没看到吧哈哈哈哈==

边学边写萌萌哒

在前面说自己怎样脑洞出从产品角度学excel之后,在经历了一系列如市场调查或者深入研究或者梳理问题和脑洞后,这系列文就诞生了。

基本上我是边学边写边查资料边读代码边做实验边写文章,所以速度还蛮慢的。

而且这个主题,其实是一个非常跨界的东西。举例来说,在这个过程中,当我们从产品设计这个角度去看excel时,有很多跟产品相关的知识需要我去补充,譬如说:

1)excel的产品设计的逻辑是怎样子的,各个部件之间是如何牵连到一起【产品设计逻辑】

2)excel的开发者是以怎样的角度去设计excel的功能模块以及排版?从界面上我们可以看到怎样的设计思路?【软件界面排版、原型开发】

3)excel的数据存储的类型,以及内在的逻辑【软件开发、数据存储、数据结构】

这上面的很多东西都是我不大懂,或者还没有来得及接触的。我相信很多从excel出身数据分析,懵懵懂懂加入数据分析职业的人,也是有同样的感受。

因此去研究excel整个产品是怎样设计的,如何读取存储数据等等,对想要往编程或者数据产品靠拢的我来说,是一件很有趣又很有挑战性的事情。

而且这个本身要查阅很多的资料。所以我在连载这系列的时候,基本是带着研究的心理去干的。有时候有些点会写的很深,有时候被什么点卡住了就很久都动不了笔(最长记录是一个月又一个星期写不出一篇东西哈哈哈)

但整体来说,这个系列让我写得很愉快,或许该说边学边写萌萌哒?更新慢这个就无所谓啦

最后的话唠

具体的怎么写,和写了什么内容学了什么东西我就不说了。不过可以再话唠一下关于怎么学习excel,或者说怎么从excel这个圈子里跳出去,站在用工具的人的角度用excel的事情。

我觉得对于用excel入门数据分析的人,有一个很大的麻烦,就是我们并不懂得什么叫做“数据分析”。

或者说,我们并不懂得“计算机到底是怎么一回事”。

像excel小白最爱问的一些问题,跟单元格文本和数字相关的,如身份证号码变成科学计数法啦,为什么有些单元格的数字不能相加相减啦

这些在各个编程语言里都是首要要介绍的内容,字符string和数值间的差异与编码之不一样。

excel再怎么跳脱,它只要是用计算机编写出来的程序,它就无法跳脱这个范围。

所以不懂一定的基础就去用excel,或许我们可以对excel死记硬背,但到了一定程度就不行了out了踩坑了。更坑爹的是,有些东西如果你只会死记硬背不懂得背后的道理,你就不规范操作,然后出错了还不知道自己干了什么傻事,反觉得excel很不好用

excel应该属于入门容易,但是容易因为各种操作的不规范,或者使用者不懂数据,而给操作者带来各种麻烦的工具。

因此,学excel要避免踩坑,就要先理解这些操作的一些原理,还有数据的一些特点(举例,宽数据窄数据,文本数字等等)

从原理出发理解为什么我要这样放数据,为什么要这样改数据,比你随便打开一本excel书,死记硬背,要实在多了。

同理,对于excel学到一定程度的人,再去补一些跨界的知识,你也会有新的收获,不是被excel玩,而是玩excel

而实际上,这种学习的过程,跟学很多其他数据工具是相通的。计算机的本质其实就是那么一回事情,软件的开发,不管是做excel还是做什么,都要遵从类似的规则。你对数据的本质、计算机的本质,软件产品的开发原理理解的越透彻,你越能理解excel,理解数据分析,还更能触类旁三去学其他的数据分析工具,学的更快

这不仅仅适用于excel,还适用于各种各样东西的学习

归根到底,这其实是一回事情

最明显的举例就是,一些菜鸟程序员会一整天纠结我要用哪一种编程语言好。但是他们欠缺的其实是算法、http协议基础、计算机科学基础、软件工程、数据结构等等。而大牛用什么编程语言都很快上手,因为原理也就那些

好了。。好啦,今天的分享就到这里了。目前为止,我对excel的研究,大概到,知道excel用xml树形结构存储数据,以及单元格区分文本数字、以及特殊格式的方法。

未来的话,大概就是继续看看行与列,还有各个组件(如图表、透视表、公式等等)到底是怎么一回事,以及讲讲用excel这个产品做一个合格的报表产品的事情。

或许还会吐槽一下自己年少无知时踩过的excel的坑,还有如何在一个只用excel的团队艰难推广报表管理以及引进新技术控制报表复杂度的等等内容

反正会边学边看边写啦。写得很慢,跨界要学习的东西很多。等不及的,上海地区提供一个有偿的excel私教啦,赚点零花,还要被包顿饭。不接受长期辅导。。

自由讨论

1、能不能举个例子,从开发的角度、产品设计的角度,让我们窥一窥门径。

尾巴:举个例子,还没在博客里说的,有人知道为什么excel的单元格不能随便移动,但图表可以乱动吗

飞吗:excel单元格可以移动啊

Wendy:所有的设计和更新都是沿着更易于使用 的方向前进着

咖啡:这问题根本就没去想过。。。。

尾巴:但是单元格移动了就会覆盖了哦,除非用拍照功能

Wendy:产品的背后就是业务实际需求

春天在心里:嗯,我也没想过,不过可以猜出,要是移动的话估计会打乱整个布局

MVP李懿:数据和数据的展示是不同的概念

尾巴:在微软的官方文档里有提到说,excel用的是一种xml格式,在它的定义里,单元格和图表还有评论等等,都是独立的

Wendy:单元格是一个个单独的个体 但是我们往往需要的是一个集合体,从业务角度出发,没价值,但是图表是一个成品

尾巴:我大概的理解就是他们看似在一个层面上,但其实不是在一个层面上,相互之间独立,所以你可以随意移动图表,却不能随意移动单元格。同理就如文本框、对象等等

K:不跟03版的构架图差不多

胜千王建:因为单元格是open xml形式存储的,类似于当下的JSON结构

春天在心里:嗯 也就是单元格是个最小单位了,图表呢,也是个最小单位,图表和单元格不能比,是独立的

尾巴:然后像现在市面上很多读取excel内部数据的插件,譬如r语言里的readxl包啊什么的,其实他们就是在读里面的xml文件

Wendy:一谈技术 我就蒙了

E:03与07是有差别的,03不是使用xml?

MVP李懿:架构是由业务需求决定的,单元格是存数据的,其他一切都是为数据服务的

尾巴:包括vba,也就是对某一个对象的属性在操作,所以懂它的架构,学vba什么的都快很多啦,虽然我还不大会vba

春天在心里:这里咱重点要看尾巴的思维,具备了思维就很牛叉,这点很独特

尾巴:我相信现在那些开发excel插件的人,对excel的架构什么肯定比我们理解的更透彻,只不过大家都不咋说,或者就在苦逼的开发者里面说。。。有兴趣你们可以去问问他们。

对了,03不是用xml的,微软据说是为了保证好修改,才在07以后从二进制文件bin,改成xml格式,这是一个好的方向,不然按bin走,没谁看得懂。

MVP李懿:二进制文件其实也是一个很伟大的发明,xml是由于计算机存储和性能的加强的必然结果

2、Excel 有哪些可能需要熟练掌握而很多人不会的技能?

尾巴:两本书,《让excel飞》,和最近看到的《三张表格走天下》,我基本不研究excel的高深技法,连vba、数组什么的对我而言都觉得有点深了,一般复杂一些的操作,用其他工具能解决的很好。

尾巴:基本上,vlookup,懂单元格的属性,透视表,getpivotdata、做图表懂了,日常都够用了。。。

3、除了使用SharePoint,Excel有什么办法能够在浏览器上查看(客户端无需安装Excel软件)?

MVP李懿:@胜千王建 Excel online

春天在心里:chrome 浏览器可以查看吧 云端的那个叫什么

尾巴:浏览器那个,你们可以去搜smartbi,他们貌似可以浏览器端看excel报表,群里应该有他们的人

K:一年几百块你就可以买office 365

4、老师有什么推荐的数据分析工具吗

尾巴:推荐的数据工具有很多。。。要看实际业务来决定的。譬如说,如果数据量太大处理麻烦用什么,或者可视化用什么

5、平时工作中,需要用到大量的颜色色块作为区分,本人没有艺术基础,不知道用哪些颜色搭配起来比较好?字体颜色,以及底纹色块

MVP李懿:用套用的格式吧

风姑娘:EXCEL里设计可以调同一系列的配色版的

MVP李懿:必要时加条件格式

尾巴:配色版那个,升级excel到10或者13,默认色块就很好看了。。。我属于那种不喜欢折腾的人,具体你也可以看看刘万祥老师的配色相关的文章。

咖啡:嗯嗯,上次去听过一次刘万祥老师的分享,确实不错

7、excel 目前能承受多大数据量呢

尾巴:网上有答案,按行算。。。经验来说,超过30M打开就很麻烦了,容易崩溃

MVP李懿:要看做啥事了

Wendy:那excel能运行数据量多少取决于什么呀

尾巴:内存吧

Wendy:仔细一想关于excel的问题好多

K:我就见过有些人做excel 狂引用的 ,最后动一个数据要卡你半天,用的还是那种数组 ,多函数嵌套等等

Wendy:excel 又是存储数据的文件,又可以分析,学到尾巴老师的精髓 哈哈

尾巴:最讨厌那种嵌套了。。。因为这种引起的崩溃和修改困难,是逼我去学写代码的根本原因

春天在心里:额 我最近就玩嵌套,看的很享受的样子,给人厉害的错觉,拿出去可以装逼。

Zhangqin:excel处理小数据感觉还行,数据量比较庞大了,瓶颈就显而易见。

主持人:好的,感谢尾巴给我们带来的深度分享,确实是很新颖的一个角度,从产品研发的角度深度剖析Excel使用,是不是能更快get到相关技能,还能理解的更深刻!

我们今天的微信直播活动到这里就要结束了,还有疑问的记得提问到社区https://ask.hellobi.com/question, 一大波嘉宾在等着回答。


下期预告:

2016年06月24日晚8点半微信直播交流大数据挖掘:系统方法与实例分析交流会第21场https://www.hellobi.com/event/66

今天的微信直播活动到这里就结束了,喜欢天善智能的朋友们请继续关注我们,每周五晚8:30,我们不见不散哦!

每周 Friday BI Fly 微信直播参加方式,加个人微信:fridaybifly,并发送微信:公司+行业+姓名,即可参加天善智能微信直播活动。


推荐 3
本文由 天善智能 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册