【Friday BI Fly】2016年04月15日 零基础入门数据分析、数据分析师的成长路径微信直播文字版记录 【全程回放】

浏览: 3585

Clipboard Image.png

公告&预告

【公告】周五BI飞起来,天善商业智能BI社区每周五下午举办问答社区在线答疑活动,每周五晚20:30举办行业、工具、技术相关的微信在线直播活动。

【预告】Friday BI Fly  周五BI飞起来 。到目前为止,微信直播活动已经安排到6月3日,未来几期的主题有:金融行业大数据精准营销、python零售入门实战、大数据挖掘与违约欺诈分析、银行报表案例分析、传统行业如何玩大数据、几个KPI看懂零售行业数据分析、Python爬虫技术应用案例(结合天善用户分解),干货满满!详细情况请关注天善智能问答社区活动页面http://www.flybi.net/project,参与方式见文章最下方。预告下期分享主题:

1、银行报表那些事儿

2、银行报表案例分享

3、银行业务和科技的融合

Clipboard Image.png

Clipboard Image.png

2016年04月15日 Friday BI Fly 微信直播主题 – 零基础入门数据分析、数据分析师的成长路径

Clipboard Image.png

主持人:加入本群的同学们,感谢大家参加由天善智能举办的 Friday BI Fly 活动,每周五微信直播,每周一个话题敬请关注。

【群规】本群为BI 行业、技术、工具交流和学习群。不准发广告,只能发红包,发广告者一律移除微信群。

往期内容回顾

Friday BI Fly 周五BI飞起来,天善智能每周五微信直播文字版记录见天善智能问答社区官方博客http://www.flybi.net/blog/tianshansoft/category/354,内容包括零售行业、旅游行业、数据挖掘、大数据、用户画像等相关的讨论交流。也可以通过天善智能公众号查看历史信息来查看我们往期微信直播活动的文字版记录。

本次微信直播讨论内容

1.        未来必备的工作技能——数据分析

2.        零基础入门数据分析

3.        数据分析师的成长路径

本期嘉宾介绍

 菜鸟数据美女讲师团

Clipboard Image.png

王宇童(Olivia)

·        美国宾夕法尼亚大学国际教育发展学专业在读硕士;

·        新加坡国立大学材料科学与工程专业荣誉学士;

·        曾任新加坡著名教育机构,负责市场调研与项目研发;

·        曾任新加坡对外企业发展局分析师;

·        曾任亚洲竞争力研究中心经济数据助理研究员;

·        菜鸟数据联合创始人;

·        主攻方向:统计学原理与统计在商务、经济与教育中的应用, 线性代数、矩阵分析、大数据中的数学基础。 

Clipboard Image.png

杨卉(Shadow)

·        瑞典斯德哥尔摩大学社会经济学专业荣誉硕士;

·        曾任著名咨询公司咨询顾问;

·        现任大连拓中教育数据产品经理和高级数据分析师;

·        天善智能社区特约专家;;

·        “人人都是产品经理”起点学院特邀讲师;

·        菜鸟数据创始人;

·        主攻方向:产品市场定位,数据应用落地,用户行为研究

Clipboard Image.png

白晓岚(Xiaolan)

·        华中科技大学电子科学与技术系荣誉学士;

·        北京大学电子通讯工程荣誉硕士;

·        香港大学Information Technology in Education荣誉硕士;

·        曾任某知名在线教育公司教学服务部经理、国际合作主管;

·        菜鸟数据联合创始人;

·        主攻方向: 教育大数据及学生行为分析, 教育教学中的科技应用;

Clipboard Image.png

潘维(Vicky)

·        清华大学产品设计专业荣誉学士;

·        现任大连艺术学院艺术设计学讲师;

·        菜鸟数据联合创始人、设计师;

·        主攻方向:数据可视化设计,数据报告撰写 ;

Clipboard Image.png

孙静(Sunbel)

·        香港大学教育学院比较教育学荣誉硕士;

·        北京大学外国语学院荣誉学士

·        曾任华为技术有限公司海外分公司公共关系经理;

·        中国青年旅行社总社海外业务部经理;

·        中公公务员面试技巧讲师;

·        菜鸟数据联合创始人;

·        3年软文写作、网络营销经历,多个经典营销策划案例, 多个重要平台长期合作伙伴;

·        主攻方向:简历设计与优化,面试技巧,职场生存之道 

菜鸟数据为大家精心准备的课程,感兴趣的戳下面的网址啦!

微专业 / 数据分析师 零基础成为年薪20万的数据分析师 http://major.hellobi.com/
零基础入门数据分析师课程安排—来自菜鸟数据团队, http://www.flybi.net/blog/tianshansoft/3623
零基础成为年薪20万的数据分析师培训视频教程:
【三个月零基础入门学习数据分析】美女讲师团倾力打造菜鸟数据NO.1

http://www.hellobi.com/course/59
菜鸟数据教你从零开始学习数据分析 【免费连载】 http://www.hellobi.com/course/47 月底更新完毕

主持人:看到这么多美女讲师,你的反应是什么?是不是学习劲头儿更足了,这么可爱的老师全程教学跟踪辅导,肯定不能掉队啊,加油加油,在不久的将来你就从一个数据分析表白晋升为数据分析高手了!废话不多说,我们赶紧邀请杨老师给大家带来今天的分享吧@Shadow杨。

Shadow

Hello,各位天善的小伙伴大家好,很高兴能和大家在这里见面,为大家分享数据分析中的那些事儿,菜鸟数据是一个立志于系统化教授大家数据分析技能的这样的一个小团队,现在因为数据分析的火爆,越来越多的小伙伴,想知道如何零基础入门,那么今天呢,我们就为大家带来这样的一场分享。OK,现在开始我们今天的分享,大家好,我是Shadow。

数据分析,未来必备的工作技能

Clipboard Image.png

Clipboard Image.png

首先我们来看看,为什么说数据分析是一门技能,。首先,数据分析是一项专业技能,除了普工和搬运工,上到总监,下到专员,任何行业任何岗位都需要,因为你的工作离不开问题的发现、问题的分析、问题的呈现。改善流程、提升效率、节约成本、经营分析、业务分析等,都离不开数据的整理、分析和呈现。这些,都是需要数据分析技能的。因为,用数据说话,用图表呈现,已经成为职场的铁律。既然数据分析是一项技能,必然要依附于具体的业务,需对业务有深刻的认识和体验,而不仅仅是了解。从这个意义上讲,脱离了具体业务的数据分析,其实就是水中捞月,玩数字游戏罢了。所以数据分析师,必须贴合业务,而慢慢的大家就会发现,因为对公司的了解,你会做越来越多并不是本职的工作,产品经理、运营、高管等等,都是数据分析师的转型方向,而我个人认为,随着数据分析的普及,未来也不会有专职的数据分析师了。

其次,数据分析的前提是要有数据。很多企业是没有数据建设和数据沉淀的,没有用数据说话的氛围,屁股决定脑袋是老板一贯的作风,所谓的数据分析报告,其实就是求证型数据分析方法,也就是选择性的整一堆有利于自己的数据来证明自己拍脑袋的结果正确性。内部所设的所谓数据分析岗位,大部分就是简单的汇总数据、录入数据,形成简单的统计报表,仅此而已,岗位价值在哪里?这样的岗位,可替代性很强,一般的文员就能胜任,而企业需要的数据分析师必然不是这种,当然了目前为止大多所谓的分析师,都是这种。所以,作为数据分析师,你必须要完善自己的知识体系,做到走在业务发展的前头,学会洞察和商业上的思考,如何培养商业的思维,因为时间有限我就不讲了,具体的大家可以看8月份天善的书,在那里我会有一个专题,如何培养商业思维。

最后,也是我认为现在大多数菜鸟的误区,很多人一来问我就是数据分析师要学习什么技能,用什么算法最常见,这是优术,而非优道,做为未来企业需要的数据分析师,企业的医生,思维的局限是很不可取的,技术的潮流我们是永远也跟不上的,(貌似我总在说这些),比如说很多人系统学习了数据分析的方法和技术,掌握了数据分析的思路和工具,就一心寻找数据分析师的工作,这是错误的认识。我们必须要端正了数据分析落地的作用,如果只是马后炮的话,对于企业就是完全没有价值的,你在实际的业务工作过程中就会养成用数据说话的思维,进而让数据分析为业务服务,而不是为岗位服务。

零基础入门数据分析

那么可能很多小伙伴说,我非常想学习数据分析,为我的工作加油,那么需要学习什么基础知识呢,下面这张图是我在网上找来的,大家有可能看不清楚,我这里给大家概括讲解一下,简单来说,完整的数据分析流程:1、业务建模。2、经验分析。3、数据准备。4、数据处理。5、数据分析与展现。6、专业报告。7、持续验证与跟踪。

Clipboard Image.png

那么下面呢就给大家一个入门的捷径:第一门必修课:统计学,下面就有王宇童老师给大家带来统计学的分享。

大家好,我是这门统计学基础的讲师,我叫王宇童Olivia,很高兴可以和大家共同学习探讨这门统计学基础课程。

这门课主要是服务于我们菜鸟数据的一整套课程,像接下来大家会接触到的R语言等等。统计学呢,是大数据分析的一个重要的基础。这些基础的知识有可能大家因为之前自己专业的缘故并没有系统地学过,或者可能都忘记了,只是零零散散的记忆。

首先,当看到这门课时,我们的脑海里一定会出现以下这三个问题:什么是统计学?为什么要学习统计学?以及统计学有怎样的应用?我们说,统计学是百分之百面向实际应用的,是搜集、分析、表述和解释数据的科学与艺术。

为什么说它是科学?

在商业和经济活动中,我们搜集与项目或课题相关的数据,对他们进行归类、分析,提取重要的信息并予以表述,这样做可以帮助管理者或决策者更加清晰地洞察市场和经济环境,做出更加科学、优化的决策。

就比如说,新加坡的亚洲竞争力研究中心,其中一份影响很深的研究报告是关于中国34个省包括港澳台地区的综合竞争力评估,通过搜集中国34个省份10年内的102项经济指数,进行数据分析,从中发现发展的趋势和特点,来为新加坡政府及企业在中国的投资决策提供建议。而在这个过程中无论是对庞大的数据进行分析,还是通过饼状图、柱状图等等数据可视化的方法进行表述,都会用到我们即将要学习到的统计学知识。

为什么说它是艺术?

中国的GDP每年以7%的速度增长,现在却降到7以下,对于这样的数据,有些偏悲观的人认为,中国经济放缓,对这个数据表示担忧。而有些人看到这样的数据,可能会综合考虑到中国经济发展到达了转型期,而这也就是一个必然的结果。同时相比较其他在转型期的国家,别人可能经济数据更差,而中国经济是软着陆,而不是硬着陆,这反而是一个乐观的数据。所以说,对于同一组数据,每个人因为考虑的因素不同,想法不同会有不同的见解,这就是一门艺术了嘛。

Clipboard Image.png

统计学包括描述统计学和推断统计学。

描述统计学是指使用特定的图标和数字来体现数据的集中程度和离散程度。例如工厂一个月中每天生产零件的平均数量、最高数量、每小时生产数量的分布是属于描述统计学的范围。

推断统计学是指根据样本数据推断总体数据的特征。例如工厂生产零件的质量的检验,一般会采取抽样检验,根据所抽取的样本的质量合格率对总体的质量合格率进行一个估计。
这在之后的课程我们会逐步讲解,在这里就不多说了。

统计学的应用是十分广泛的,例如会计:会计师事务所在为客户提供审计时,很难去详细查看和验证每一笔账款,因此就需要使用统计抽样的程序,通过选子集,来确定客户所提供的账面上的收入是否真实地反应了实际账款的金额。同样,在市场营销中,如何通过分析搜集到的数据,理解促销活动和销售额之间的关系。

推荐读物:

那么,我们身边其实到处都体现着统计学知识的应用,大家有时间的话,推荐大家读一读这些读物。这里面的文章体现了如何依据统计数据做出预测、判断或者是结论。

Clipboard Image.png

课程知识体系:

Clipboard Image.png

描述统计学:表格法、图形法和数值法 我们在学习的过程中都会一一介绍,当然,这些都是统计学中最基本的,关键还是要看如何根据实际情况进行应用,有效得解决实际问题。

概率:由浅入深,从复习简单的计数法则、加法公式、乘法公式、再到条件概率和贝叶斯定理。

概率分布:接着,我们会对概率的研究进一步扩展,引入随机变量和概率分布的概念。随机变量分为离散型随机变量和连续型随机变量。

抽样和抽样分布:学习如何从总体中选取样本,以及如何用抽样得到的数据计算总体的估计值。此外,我们还会介绍抽样分布的概念,抽样分布可以使我们了解样本估计值与相应的总体参数的接近程度。

区间估计:我们往往不能从点估计量给出总体参数的精确值,所以会在估计量的基础上进一步计算区间估计。

假设检验:顾名思义,假设检验就是检验假设,我们会学习对总体均值、总体比率和总体方差进行假设检验。我给大家举几个例子:
对总体均值进行假设检验的应用

比如说某家企业的产品研发小组研制出一种新型的的产品,在企业投入生产之前,我们需要知道新型产品是不是比现有产品好,那么,我们就可以对新产品的性能,比如说,完成某项任务的平均时间是否小于现有产品完成该任务的平均时间,进行假设检验。
总体比率的假设检验

某种软件推出了一项新的专门面向女性消费者的销售策略,运行一段时间以后,我们就想知道,这个策略到底有没有效果啊。我们需要知道该软件用户的男女比率是否有产生了变化。在这里,我们就会对总体比率进行假设检验。
两总体均值和总体比率的推断

我们也可以对两个总体均值或比率进行假设检验:我们可能需要男女两个总体的平均起薪的差异进行假设检验,或者对供应商A和供应商B所生产的产品中次品的比率是否存在差异进行假设检验
总体方差的统计推断

举例说明:灌装牛奶的生产工序,尽管说一千克的平均值是作为标准,是我所期望的,我们不能指望每个容器的平均重量都是恰好一千克。因此灌装量的方差也很关键,如果方差过大,即使平均值是一千克,也可能出现过度灌装或灌装不足的情况。
拟合优度检验和独立性检验

继续扩充我们对总体统计推断的能力。拟合优度检验和独立性检验的数据呢都是分类型的,所使用的检验统计量都是基于不同的概率分布。

实验设计和方差分析

方差分析ANOVA的统计方法如何能用于现有数据分析。
简单线性回归

进入到回归分析的学习。我们知道,管理决策往往取决于对两个或多个变量之间的关系进行分析。比如说:权衡广告费与销售额之间的关系,每日最高气温和用电量之间的关系。
如果能取得这些数据,我们可以利用统计方法来建立模型,进行分析。
我们从简单线性回归入手,考虑两个变量之间的关系,进而考虑更多的因素,学习多元回归 。
时间序列分析和预测

时间序列也是在学习统计学时候的重点,最后,大家在学习有关统计学的时候有问题的话呢,可以在天善社区上给我留言,谢谢大家。

Clipboard Image.png

Clipboard Image.png


Clipboard Image.png

第二门必修课:R语言和数据挖掘基础,下面呢我来给大家介绍一下这两门知识的学习路径。

首先R语言是一门非常强大的数据分析工具,第一:它是免费的,第二:它很好入门,第三:它的普适性很强,解释一下:R语言的部署是非常简单的,它适用于几乎所有的数据库,可以导入几乎所有的数据源,很方便自学(顺便吐槽Spark),目前为止R语言的学习的资料是非常之多的,2500个包,几乎可以满足你所有的日常的工作,如果你的统计学基础比较OK 的话,是非常好入手的,推荐大家一本《R语言实战》,大家拿着这本书,把里面所有的代码都敲一遍,编一个数据,练习下,就很快会掌握R语言的使用技术了。

再来我们来说一下数据挖掘的算法,目前为止呢,数据挖掘常用的算法呢,就是基础的算法,大家可以看到PPT中给大家列举出来了,所谓的高深就是大家缺乏实际应用的场景,比如反欺诈用什么算法,购物车分析用什么算法,这里面我比较建议大家买一本《数据挖掘导论》,这本书呢相对而言对初学者是比较容易上手的,其中呢,我们要重点学习的就是数据挖掘常用的十大算法,同时也有这本书《数据挖掘十大算法》,大家可以买来好好的研读下,多去实际操作一下。

Clipboard Image.png


除了这些技术之外呢,大家可以看到上一张PPT,有这么多的技术是数据相关的,我画框框的部分,是我比较推荐大家去学习的,SQL、Mysql、Tableau,Python,当然如果你的工作环境允许的话,你可以研究一下spark,在你基础OK的前提下。

Clipboard Image.png

Clipboard Image.png

Clipboard Image.png

Clipboard Image.png

因为时间的关系呢,Tableau的学习重点和数据可视化及报告的攥写在这里就不给大家详细的介绍了,数据报告可以说是收口的一个程序,是非常重要的,对于不同的分析报告,重点有所不同,对于不同的汇报的人,它的内容和形式,关注点也是不同的,这个部分,有时间的话,再让白晓岚和潘维两位美女讲师给大家详细的分享。

大家原谅我是真的比较懒,这个Tableau是之前课程整理的重点,不是在打广告,我就是懒得再整理了,大家看看,学习的时候可以着重学习,书籍和学习的资料也是很多的,推荐大家关注一个微信平台AAS数据可视化,同时GrowingIO这个平台也是很好的,大家可以关注下,哈哈哈,这里打个广告,欢迎关注天善智能平台和菜鸟数据平台,也是满满的干货!

数据分析师的成长路径

虽然大家印象里还是会觉得数据分析师是一个技术工种,在前几节课学习一下概念啊,工具啊,可以解决问题就可以了。但事实上,这是一个误区。概念和工具只是让你能够进行数据分析的工作,但要从数据分析工作,而真正成为一个数据分析师,并且是一个有着清晰职业规划、上升途径的数据分析师,还需要弄清楚两个很关键的问题,一个是这个工作到底是什么样子?一个是我真的适合这个工作吗?如果我也认为自己适合,怎样说服别人也相信我适合这个工作而愿意雇用我呢。第一个问题和第三个问题使我们上课的重点内容,作为初级的数据分析师很大程度上还是一个支持性的工作,帮助其他部门,尤其是业务部门做决策提供数据,这时候就会发生相应的人际关系,能够处理好这些关系是最重要的能力,也是你在应聘过程中会被考察的重点。而第二个问题,就是我真的适合这个工作嘛?这是要同学自己回去多思考的,虽然你报了这个课程,但不一定你对于这个工作有了充分的认识,也不一定你对自己的兴趣、能力有了充分的认识,在课上我会给大家一些思考的方向,大家也要积极评估考量,看看自己是不是真的适合数据分析师。

在思考这三个问题的过程中,我们将会收获以下几点。第一个是对行业、职业、公司、个人的了解和理解。从行业到个人,理解每一个层级的需求都需要大量的工作。而分析师最重要的能力就是在大量的信息中挖掘和判断。有了基础的了解之后,我们会细致到简历和面试这个步骤。让大家了解公司对数据分析师的需求是怎样的,又是怎样考察的,知己知彼的基础上制定应对的策略。

关于巅峰这个事情,还要多说几句。很多小伙伴很关心工作待遇的问题。可以这么说,数据分析师待遇还是很有竞争力的,而且你们现在选择进入这一职业,还是属于黄金期。数据分析这个工作一直都有,但只有在13年后,当电商啊,互联网啊,后来的移动互联网啊,真正进入大数据时代,才有那么多数据让你能够分析、管理,数据分析才需要一个专业的人士来做。G按人头呢日著名的新兴技术炒作周期的2014年和2015年报告中最大的变化就是已经把大数据从新兴技术变成定位为主流技术。大数据的发展催动了数据分析的往更职业、更专业的方向走,所以对于数据分析师的需求就原来越大。从2013年开始需求激增,到现在依然火爆,应该至少持续到2018年。所以三个月后你们就可以成为香饽饽了。他的特点我就列在这里,但是工资薪酬这个数值根据公司啊,政策啊,城市啊,等等变动很大,我们只是说一个大概的范围,但一般会比同级别高出20%-30%。但作为快速成长期的职业,数据分析师的好处还是很明显的,钱多人少,这是一个供求。在二线城市一般入门也会有4千左右,一线城市就是6-8千。入门快,就是只要你有点统计或者计算机的基础,入门是很快的。哪怕都没有,也可以快速建立相关能力。数据产品运营,数据分析师转行容易,现在数据分析师大多是技术转型做的,单数据提取不是业务来的,属于马后炮的形式,与业务脱节,是其实数据无法落地的症结所在,那么复合型的数据分析师是非常有发展前景的,上升快,因为数据分析师还是个新兴岗位,在行业内并没有多少有经验的从业者。所以,大家都要从零开始学,你上面没有更资深的人压着你,包括这个职业一般直接同老总对接,因为要提供数据支持决策嘛,所以上升是很快的,一般两到三年就可以有一个质的飞跃了。在传统行业中,数据分析更多存在移动、银行、超市等行业,在这些行业中你才会偶尔听到数据分析师这个职位,也许更多是听到数据库工程师、需求分析师。互联网、移动互联网、游戏、通信类的企业,因为这些类型的公司是数据都较为庞大,并且也较为重视数据分析工作的公司。统计、会计、金融、数学、计算机等专业的同学应聘数据分析师有优势,但其他专业若对这个职业感兴趣,通过日常学习,掌握一些统计必备技能,亦可以从事此类工作。

这里给大家看的是上海的一个情况,仅作参考吧。总体说数据分析师是一个性价比很高的职业,投入相对少,收入相对快,周期又短。

从上升路径上来说,就是先是只能打杂的助理分析师,然后可以独立带项目执行变成数据分析师。在分析的业务能力上不断提高,可以在3年左右变成不仅能深万巨额还能做出预测的资深分析师,这时候对于行业、数据分析都有了相当的积累。最后知道变成专家,可以进行决策或者决策支持。推进业务,指导团队,做到统筹规划的层面。完成从业务到决策的飞跃。当然这一层不仅需要业务分析能力啊,执行管理能力啊,业内影响力啊,基本就是一个高级经理人的层级了。如果你到这个层级,你在行业内信息的积累,能力的沉淀,可以转型或者做咨询,数据就是你咨询的底气啊,这个沉淀是会持续增值的。

对于任职要求说,白了主要就三点要求:工具要熟悉;业务要懂;沟通要好。可能不同的公司因为需求不同,会在要求上有点小小的不同,而这个不同主要集中在数据库上。当然还有一些细致能力:严谨、负责、不能隐瞒问题。比如逻辑思维要好啊,要弄清楚结构,在错综复杂中找到最优方向。要有持续学习的能力-擅长模仿,但勇于创新。这些都可以从以后具体的分析公司需求里面总结出来。

OK ,今天的分享内容到这里就结束了,谢谢大家!

主持人:谢谢shadow老师以及其他几位美女老师的分享,信息量非常大,首先我们要认识到数据分析的重要性,它是我们未来必不可少的工作技能之一,其次我们应该如何零基础入门数据分析,老师讲解了各个环节需要学习的知识体系,推荐读物等,最后讲解了数据分析师的成长路径,就是告诉我们,不光要入门,后续的学习、晋升路线是怎样的。老师已经从头到脚的为我们考虑全了,小伙伴儿们是不是活动之后就要投入到学习当中了呢,如果有需要学习我们菜鸟数据几位美女老师的数据分析课程的,可以戳这里咨询:微专业 / 数据分析师  零基础成为年薪20万的数据分析师 http://major.hellobi.com/下面我们进入自由讨论时间咯

自由讨论

问题1都说数据有前途,但是好迷茫,能不能讲落地啊

Shadow 杨:这就是一个很落地的数据分析入门的知识体系,统计学-R语言-数据挖掘-Tableau可视化-数据报告的攥写,然后就是沟通的能力,销售自己的能力,这是一个完整的数据分析的流程,也是大家在学习中可以重点学习的部分。

 

问题2请问R语言能不能用Python代替呢,还有,为什么要吐嘈spark

Napoleon因为scala太难了。

Shadow 杨:R语言是统计学语言,Python是编程语言,这两者没有谁好谁坏,我建议是都要学习,R语言先学,统计学思维先打下,如果先学习Python就很容易有技术思维,R语言上手后学习python会很容易学习。

xu 创标:主要还是时间不太允许这样做。

napoleon谣传太阳系最难语言。

Shadow 杨:@xu 创标 因为环境部署是非常难的,即使使用虚拟机,对于学习来说,不是很适合自学。

xu 创标:谢谢杨老师,请问为什么要吐嘈spark呢,作为大数据的框架,相比hadoop还是很优秀的。

Napoleonspark是未来的趋势,因为内存越来越便宜。

Shadow 杨:@xu 创标 Spark相对会更优秀点。

xu 创标:那您刚才还要吐嘈spark呢?[呲牙]

napoleon吐槽不等于不接受,老师也没说spark不好,只是学习门槛高。

郑大鹏:入门么,都是枯燥的。

Steve Zhuscala 相比C还是简单点。

Shadow 杨:@napoleon 嗯嗯,是的。

Napoleon凡是有指针的都不好搞[撇嘴]。

 

问题4初入数据分析要进入哪个行业的数据分析?

Shadow 杨:初入数据分析要进入哪个行业的数据分析? 数据分析是非常庞大的体系,每个行业可以说都有自己的一套方法论,我个人建议是选择你比较喜欢的行业,或者是互联网相关行业。

 

问题5据我了解,r语言就可以做可视化,为什么还要用tableau

Shadow 杨:@Zhangqin 因为快和简单,比如说你每周会为业务部门出报表,如果使用Tableau的话,可以预先建设好,只要替换数据就OK了,而且业务部门的同事也可以通过简单的培训使用Tableau。

好多同学都在问有没有实例,视频教程,喏,在这里

菜鸟数据教你从零开始学习数据分析 【免费连载】 http://www.hellobi.com/course/47月底更新完毕。

微专业 / 数据分析师 零基础成为年薪20万的数据分析师 http://major.hellobi.com/

零基础入门数据分析师课程安排—来自菜鸟数据团队 http://www.flybi.net/blog/tianshansoft/3623

零基础成为年薪20万的数据分析师培训视频教程:【三个月零基础入门学习数据分析】美女讲师团倾力打造菜鸟数据NO.1 http://www.hellobi.com/course/59

隆重介绍我们的天善商业智能学院了,这么多课程,小伙伴儿们都学会了吗?

Clipboard Image.png

问题6:怎么理解学习的性价比呢

Napoleon嗯,谢谢老师

Shadow 杨:比如很多人问我,学习Excel怎么样,必须要说的是Excel是一个非常强大的工具,但是数据量越来越大,Excel的适用性就不是那么的好,那么同样学习EXCEL的时间可以研究SPSS,性价比会更高一些,相对的机会成本就小一些。

人这一生的学习时间真的非常有限,在有限的时间里学习成长,就看谁更聪明。

shadow杨对干货的理解:

我一直有一个疑问,大家每天都在讲干货干货,那么你听了这么多干货,为什么还是成不了数据分析师,为什么数据到你手上了,你还是不会处理,还是没有数据分析的思路?

我对干货的理解是,我有了基础,我听大神们的实际的工作应用,我可以提高我自己,那么很多菜鸟们连基本的回归模型,什么叫朴素贝叶斯都不知道,怎么能凭着停了大神们的干货分享就入门数据分析师呢?

问题7@Shadow 请教数据分析师和BI前端工程师的区别和联系?

Shadow 请教数据分析师和BI前端工程师的区别和联系?我必须承认我不太了解BI,但是其实很多东西都只是叫法不同,职能可能都是相通的。

 

问题8数据分析和BIbig data什么关系?

Napoleonbig data为数据分析提供了技术支撑。

Shadow 杨:BI和Big data,我感觉只是换了个名字,数据分析是顶层的应用。

 

问题9所以要数据分析师,要先熟悉统计学吗?

高靖:总结为三句话:学一些统计学知识;掌握一门语言;了解些挖掘模型

Lion统计学是数据分析的基础啊

Shadow 杨:@高靖 [流泪]我觉得我白讲了,是业务啊

Max数据分析要依赖具体业务

高靖:切入点是业务

Shadow 杨:是的

Simon窃以为技术和业务都要掌握,但应以业务为指导,为主线。

Shadow 杨:@Simon [强]

 

问题10练习数据去那找呢

Napoleon现在缺数据啊

Shadow 杨:@napoleon 有很多网站你可以下载到数据,或者你可以自己建一个网站,或者博客,架一套免费的数据分析工具,收集数据

Shadow 杨:@napoleon 或者是爬一些,如果不会爬虫的话,可以考虑八爪鱼和搜集客,如果是大型数据可能真的相对是比较难的

Napoleon嗯,知道了

Xiaolan每年会有一些比赛,大家可以关注,比如kdd,数据量大,还有kaggle网站

Napoleon我要的都比较大

Shadow 杨:[偷笑],大型数据的处理也是我最近比较关注的。

梁勇@天善智能:关注爬虫的,社区的seng对 天善的用户关系图做了深入的爬虫案例 《Python网络数据采集》读后总结 --第3章及天善用户关系分析实例
http://www.flybi.net/blog/seng/3599,使用Echarts呈现天善用户的关系图
http://www.flybi.net/blog/seng/3645,大家有空都去看看

Napoleon数据挖掘,样本小了没有意义

赵创@谛听@人工智能生态:@梁勇@天善智能 [强]

Shadow 杨:@napoleon 还是个思维问题吧,数据挖掘的目的是洞察,找到新的突破,那么数据样本就并非是一个必要的条件,只能说大型的数据处理更考验分析师的功底。

Napoleon用数据驱动呗,机器学习,大样本程序才能发现其中的关联。

Shadow 杨:但并不代表大型数据就一定能挖掘出比小型数据更有价值的东西,举个例子,现在的数据量很大,数据纬度很全,那么就意味着,无论你持有怎样的观点,都可以找到数据来支撑,所以在未来的时候,数据分析师面临的问题不单纯是数据量不够的问题,很有可能是数据量太多,如果取舍的问题,什么数据是扰乱性数据,什么数据是无价值数据,怎么判断?靠什么判断?

Napoleon哦,理解你的意思了。

 

问题11杨老师,理论我都懂,就缺实际操作,我是统计专业毕业的。

Shadow 杨:那你可以多看看实战案例的书,我主要是做应用落地,很多时候都不单纯是技术的事情,我可以给大家举我工作中的例子。

Napoleon我是寻找数据中未知的联系。

Shadow 杨:比如实际工作中,你的分析报告和业务或者运营的分析结果有出入,存在了利益关系。

灰灰@Tableau好厉害的美女啊

Shadow 杨:比如,用户的获取成本,可能你的方法论算完是80,运营算完是50,这两份报告,给老板一看,运营部的同事肯定就不高兴了

Napoleon差距有点大啊

Shadow 杨:哈哈哈,很正常啊

Charles如果不一样?怎样处理呢?

Shadow 杨:我算过差距最大的是,电商的,我算完是130,运营算完25

Shadow 杨:首先这个报告不要大肆宣扬,直接找到运营总监,悄悄的沟通,方法论摆出来,怎么计算的,哪种更好

Charles这两种结果都是有数据支撑的吧?

风先森:用数据说服总监?

Shadow 杨:在公司要记得隔墙有耳,尤其是数据中心这种出力不讨好的

Shadow 杨:@charles 所以这就是我说的,你总会找到数据来支撑你的观点的,当企业的数据很大的时候,举个我工作中的例子

Simon我不太明白为啥要两个部门部门各算个值呢。

Shadow 杨:我之前的一份工作是在一家电商O2O公司做数据总监,公司做了一次活动,线下选商品,线上支付五折

Charles看的点不一样的

Simon这样不是制造矛盾么

Shadow 杨:新用户的注册成本,运营部门,考虑的是我为了这次活动实际花出去的钱

Charles每个部门,同一个指标口径都不一样

Shadow 杨:数据部门在核算成本的时候要考虑,活动预热、生鲜商品的损耗等等,新用户的定义,运营部门计算的是增长人数,数据部门计算的是通过这次活动,所带来的用户,这样的差距就很明显了,我这个例子说明白了吗

charles怎么做到统一口径,统一口径没有没必要?

Shadow 杨:我认为统一定义是很必要的

Simon明白了。最终沟通解决是么?

Shadow 杨:但是有的时候真的很难强求

Simon那通常谁妥协呢?

Charles很难,统一口径

Shadow 杨:比如运营部门就是很难知道哪一些用户是通过这次活动来的

linger 为啥你们做数据的好像产生了很大的价值,而我也是做数据的,好像没什么卵用

Shadow 杨:数据部门因为可以事先做好统计,而且,比如那些看了广告的用户,你就很难还原它的场景。

Simon看谁比较强势是么?[表情]

Shadow 杨:数据部门收集的就一定准确吗

高靖:样本都不一样 分析结果没可比性

Shadow 杨:也不一定是

Shadow 杨:互相妥协吧,毕竟运营部门有KPI,也要体谅,比如这次的结果就是,活动预热的部分费用剔除掉。

 

问题12:我也是做数据分析的,我目前做的东西看不到有什么价值。

Shadow 杨:@丹丹 数据要走在业务的前面,我们公司是做互联网留学的,不会有很多的数据量,以业务服务为主,这样的企业数据分析师是很难下手的。

丹丹:我们一直是在后面,不知道该怎么办

Linger虽然我懂一堆算法,但是业务目标不明确,压根用不上

Shadow 杨:但是如果万事俱备只欠东风,谁都可以做,就体现不了你的价值了

Shadow 杨:@linger 很多东西不单纯是算法的事

丹丹:所以一直迷茫

Simon有理

丹丹:不知道如何继续下去

Shadow 杨:我们做留学,是免费的申请,那么我们的企业就要靠更多的收费项目来支撑运营。

Shadow 杨:比如,我们最近在做的雅思的单项语培,语言培训。我的做法就是,先将用户画像做出来,什么时间签约、雅思什么成绩、去什么学校,学什么专业等等的学生更容易报这种语培项目,然后让咨询顾问多多关注这种学生。再根据已经报名的学生的资料,包括什么家庭情况,去完善我这个用户画像,虽然看起来数据量很小,不算什么大数据,但是对于咨询顾问来说,他心里有谱了。遇到这样的学生,推荐语言培训项目成功几率就更大,不会更抵触,再比如,我们的学生资源来自很多渠道,但是渠道并不能单纯的看数量,更重要的是质量,一层一层的转化率,再比如如何如评估咨询顾问的工作工作效果,因为资源的质量是无法估计的,所以就不能用单纯的转化率来衡量这个咨询顾问的能力,又因为留学是一个非常长尾的服务,这个学生可能要跟踪好几个月。

linger数据要走在业务前面,能举个例子么?

春天在心里:刚才就是数据画像是吧?

linger哈哈,不错。

丹丹:申请下次讲用户画像。

Charles我想百合网应该也有类似岗位,哈哈。

Linger这些潜在报名的用户会有哪些特征,这些特征怎么选出来的,统计看比例么?

Tagore我刚做了用户画像的例子,就是打了一堆标签,各种维度的。

Shadow 杨:用户的标签是要有目的的,我们还是说语言培训的项目,为什么要有是否参加过雅思考试,各科的成绩这个标签,为什么要有考什么学校什么专业这个标签。

如果要研究用户画像,我推荐大家几本书,人口原理,社会选择理论基础,社会心理学,心理学与生活,社会心理学,人格心理学,动机与人格,行为学,还有福利学。

Tagore问题数据有限

春天在心里:@Tagore 这种用户画像是用工具做的还是怎么的?

Tagore我手工做的[尴尬]

Linger用户画像我做过,但是怎么用没接触过。当时给了其他部门用。

Tagore直接各种维度放一起用spss聚类[呲牙]

Shadow 杨:福利学就是我们常说的奖励机制的设计、

Shadow 杨:@Tagore 可能是个人习惯的问题,我一般是倒推的思维

Simon[晕]看到这些书名有点晕呢,为啥呢?

Shadow 杨:话说我硕士的方向就是福利学,回国后找不到工作

Shadow 杨:@Simon 有一些书是很基础的

Simon哈哈。福利太差了是么[表情]

Shadow 杨:不是,是太完善了

春天在心里:怎么个好法 没出过国

Shadow 杨:北欧的福利学是世界上都很牛的,很多国家的福利制度都是学习北欧

Shadow 杨:@Simon 所谓基础就是枯燥,理论很强的,但是我也没找到比较不枯燥的书,真是不好意思[表情]

Simon@Shadow 杨  OK,明白了,谢谢!

 

问题13请问金融方面的数据分析有啥书推荐吗?@Shadow

Shadow 杨:金融我不是很了解哎,没怎么涉及过,你可以去论坛上问面包君,宿痕大大,或者数据分析侠.

春天在心里:@xu 创标 他好像在天善博客里分享过书籍了,你可以去博客看看,找找,希望能回答你的问题。

xu 创标:好哒,请问有博客链接吗@春天在心里

梁勇@天善智能面包君数据分析侠系列博客 http://www.flybi.net/blog/dataman
BAO胖子 大数据时代数据架构学习笔记,温故而知新 系列博客 http://www.flybi.net/blog/rayshawn

春天在心里:http://www.flybi.net/blog/dataman/3617,这个精细,内容较全,覆盖层次广泛。

Shadow 杨老师寄语:

谢谢大家了,今天在这听我们唠叨,希望对想入门数据分析的小伙伴有帮助,大家静下心来打基础,相关的书籍我都在天善平台分享过,学习的过程中有问题可以在天善平台留言,学习中的不懂的地方啊,弄不明白的啊,都可以问,希望更多的小伙伴能够加入到数据分析师的行列。同时即使你从事的是其他的行业,也需要有一点了解,对未来的职业发展很有好处。

小伙伴对Shadow 杨老师的感谢:

Clipboard Image.png

主持人:感谢支持天善的朋友们为我们十多个群同步转播,让我们七八千小伙伴儿都能享受到各个行业,各个技术领域嘉宾的给力分享,也感谢我们各位小伙伴在工作之余,下班之后还能持续两个多小时守在电脑或手机旁,安静听分享,积极参与讨论,天善有你们的支持,一定不负众望,后面继续为大家带来有关于数据的行业、工具、技术经验交流。

预告下期分享主题:

1、银行报表那些事儿

2、银行报表案例分享

3、银行业务和科技的融合

今天的微信直播活动到这里就结束了,喜欢天善智能的朋友们请继续关注我们,每周五晚8:30,我们不见不散哦!

参与方式

每周 Friday BI Fly 微信直播参加方式,加个人微信:liangyonghellobi  并发送微信:行业+姓名,参加天善智能微信直播。

Clipboard Image.png

Clipboard Image.png

Clipboard Image.png

Clipboard Image.png

Clipboard Image.png












推荐 4
本文由 天善智能 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

5 个评论

辛苦辛苦,终于等出来
感谢咖啡的整理
感谢咖啡姐
谢谢分享!真棒!
感谢分享

要回复文章请先登录注册