谈谈转行数据分析以及工作的心得

浏览: 920

加油一起来

由于两个月前写了一篇文章叫《自己找数据分析工作时所犯的错误》,然后这期间就一直有人问我找到工作了吗?面试的时候,面试官都是问你的什么呢?你从事数据分析工作之后主要干什么呢?所以想在这里为大家分别解答下。

首先回答下,我确实是找到数据分析工作了(感谢我遇到的贵人)。这是我辞职回到家写的一篇文章----为什么转行数据分析。其中写了一个计划,让自己有了方向,希望大家也尽量写一个详尽的计划,这在学习的过程中不会因为方向不明确而产生焦虑。仔细的一算,我是大概辞职两个月后找到了工作,难道我真的是从零基础学习两个月找到数据分析工作的吗?当然不是,我不能为了吹嘘自己给大家带来误导。

下面我会尽可能的为大家描述下自己学习的整个过程,以及我自己犯得一些错误。然后回答面试数据分析的一些问题,以及大家想知道的数据分析工作到底是怎么样的问题(以自己的工作为例)

一:开始接触编程

大概介绍下自己,一个在2017年6月份毕业的工科男生,专业是建筑环境与能源应用工程。开始正题了,说到开始接触Python应该是2016年12月26日(刚刚考完研),这一天主要做的就是安装Python,当时安装的是Python的原生包,麻烦一些,在配置环境变量的时候一直出错,结果安装了两天,才打印出了Hello World!,其实说真的自己差点放弃。学习Python这也是起源于得到专栏万维刚老师的一期文章,提到了编程,说编程是如此之美,比学习钢琴绘画还能提高人的审美。幸运的是万老师的粉丝,也是我的启蒙老师(升哥),主动带领我们一起学习了Python,他要求我们如果碰到了问题,要先把问题给弄清楚了,这也就要求我们把问题一步步的分解,然后使用搜索工具一步步的解决 ,其实在这个过程中,思路将会越来越清楚,最后问题也就能解决了一大半了,这时再问别人的时候也能特别有效率的。所以大家在学习的时候,一定经常使用搜索工具(谷歌),自己每进行搜索一次,就能提高自己搜索关键词能力。另一方面你向别人请教问题的时候,别人能够方便的问答你的问题,为别人着想,其实也就是在为自己着想,难道不是吗?

学习Python时应该注意的问题

  • 如果大家刚接触Python,碰到的第一个问题肯定是安装问题,这其中遇到的麻烦估计就是配置环境变量了(不难,就是一不小心会错);所以建议大家,直接安装Anaconda(官网下载),在安装的过程中,会有类似是否默认设置环境变量,点击是,剩下的默认就可以。

  • 我刚开始学习的时候,当时的目标是把别人的代码抄下来,只要不报错就好了。那时间自己有一个非常不好的习惯,就是抄代码,从来不自己亲手写代码。总是想快速学习完,其实是没有经过自己思考的沉淀,过不了两天就会忘记了代码的逻辑。所以也建议大家能够自己写,然后再与别人的代码比较进行修改。点击Python的菜鸟世界会有一些简单的例子,大家可以用来参考学习的。

  • 学习编程,真的不要怕麻烦,肯定会出错,但是只要能够把错误的原因找出,一点点积累,肯定是进步很大。

  • 对于从事数据分析工作的话,刚开始先掌握函数式编程即可了。

二:对于学习爬虫建议

我原来是按照崔庆才博主的视频课程学习的,把他视频课程的代码给抄了一遍,当时自己真是太愚蠢了,只是想得到结果,没有自己找一个网站爬虫练习下,更加没有思考。
其实简单来讲爬虫就分为三个部分:

  • 取出要爬取的URL
  • 根据URL请求服务器,下载HTML页面
  • 分析页面内容,找出网页中里的其他URL,继续爬虫直到结束

如果大家打算写一个爬虫程序作为自己找工作的项目实践,推荐使用requests库和Beautiful Soup,再加上QQ浏览器上扩展程序XPath Helper,将会是非常的方便。如果大家没有这个学习资料的话,点击传智播客就业班视频。有一点还请注意,这是一个LINUX下的教程,关于学习爬虫方面,其实涉及到的LINUX命令只有进入一个文件进行编写,复制一个文件,简单的几个命令。

三:对于学习数据分析建议

在我快要辞职的时候(九月十几日左右),我就开始想要从事什么职业,当时确实想做开发的,因为当时自己知道只要努力学习,半年之后是有很大的机会找到一份不错的工作的,可是自己并不是太想做开发。在自己无助的时候,幸运的是,我到知乎上看到卡牌大师还有秦路老师关于转行数据分析的回答,让自己有了数据分析的学习方向。如何快速成为数据分析师?,这张帖子确实帮助了像我一样无助的好多人。

总结下来主要学习概率统计ExcelSQLpython基础知识numpy包pandas包matplotlib包。我的做法是直接按照博主秦路的文章学习,按照他的文章代码实现下(抄了几遍),然后自己想想看看有没有其他需求给实现下。对于SQL的学习可能在安装上会遇到问题,这篇文章-SQL入门学习能够给你写帮助;在这里多说一句,很多人认为数据挖掘的机器学习部分,是需要很好的数学基础的,其实并不是。这篇文章会给你解答--入门机器学习到底需要多少数学知识

四:初级数据分析学习书单及网站

Python基础:《利用Python进行数据分析》
SQL:《SQL必知必会》以及MySQL的官方教程
统计基础:《深入浅出统计学》、《商务与经济统计(第12版)》
电子行业业务知识:《数据化管理:洞悉零售及电子商务运营》
分析理论和Excel:《谁说菜鸟不会数据分析》
机器学习:《统计学方法》(李航)
爬虫:崔庆才个人网站

对我们转行的同学,对于上面的知识学习也要有所侧重,看下技能侧重点

说明下:机器学习部分是我们找工作的加分项目,可以先了解到逻辑回归决策树随机森林Kmeans算法;爬虫的话,也是我们的加分项目,学习Requests库Beautiful Soup这两个即可。

五:不同种类的数据分析工作要求(根据面试所得)

第一种: 我是感觉类似于数据运营,就是学会EXCEL,SQL、概率统计也就好了。我的了解是,这样的工作基本上是在互联网公司,给没有数据部门的产品经理打个下手,要求的技术并不是太高,主要是针对产品经理提出的需求来做分析。比如说,我当时面试的一家互联网教育机构,他们的要求就是用EXCEL整理学生买课的信息,看看哪一门课程最受大家喜欢之类的。这种职位的大概薪资在一线城市的话大概税前有6000到7000块(以下说的薪资范围也都是针对一线城市的。这里的结论是我面试时、或与朋友讨论、或是在某些课程上看到的,可能观察的样本不大,大家也应该多面试几家,感受下数据分析工作到底需要哪些技能。)

第二种: 是真正的数据分析职业,最起码是公司里有专门的数据分析部门,并且还能用到编程语言。这时候需要掌握的技能算着EXCEL,SQL,概率统计,还有一门编程语言Python或者是R语言,建议大家先学习Python语言,我碰到一个面试官说其实公司里面使用Python做数据分析的较多。这样一阵下来,公司就能上升到8000-1000,如果能够学习几个机器学习算法模型肯定都是加分项。

第三种: 就是数据挖掘职位了,这个就需要掌握的技能比较多了,EXCEL,SQL,概率统计,Python或者R语言,数据挖掘、机器学习 Hadoop,Spark Java,python,c++ 推荐系统、自然语言处理等。编程语言,还有熟练掌握机器学习的算法(这个一定要自己推导几遍),这个工资就不用说了,15000+。

关于这方面,自己写过一篇文章——《自己找数据分析工作时所犯的错误》。其实面试的时候,前两种类要求业务知识要一些,后一种就偏向技术多一些,面试官问的时候也是按照对应的顺序。

六:对于购买课程或者加入社群

我现在关于购买课程或是加入社群有一点点见解。我认为现在的数据分析社群之所以存在是帮助大家解决了下面三个问题:

  • 学习的方向,对于一个好的社群,能够为你提供一个学习路线。(其实按照我上文提到完全是可以的)
  • 可以解决大家的恐慌问题,因为我们都是要转行的人,对会未来会感到很大的不确定性。(有一点大家要注意,这只能解决自己暂时的恐慌,关键是一定要坚信做对的事情,长期来看一定会带来更大的复利,并且长期一定是没有自己想的那么长)
  • 加入社群之后,社群里总会有一些活跃的人能够帮你解答问题,在社群里确实降低了与人的沟通成本。

关于加入社群,我自己犯得错误是,本来按照自己原定的计划在学习,学习两周之后就看到和别人学习的内容和自己不一样,就开始怀疑自己这样学习可以找到工作吗?然后其中的知识点学习到什么程度呢?这时候就开始到问群里小伙伴和到知乎或者到简书上寻找答案,结果反倒是越看越恐慌,再后来为了解决恐慌就又买课程加群,然后立下誓言,又努力了两周,紧接着又是恐慌,到后来就只剩下了一堆资料了。大家可以看下,我给数据蛙DataFrog社群学习建议

总而言之,加入一个社群也是可以的,大家还是要记住关键只能靠自己。

七:第一份工作用到了什么技能

工作中我的主要职责是,根据甲方提供的数据和需求,或是根据甲方的数据提出对他们有价值的需求,然后选择建立的算法模型,并进行数据分析。由于现在工作是刚入职一个月,工作是不太固定的,这段时间都用到了下面的知识。

  • python 爬虫
  • Linux 命令
  • Python 的正则表达式
  • 聚类算法和spark MLlib

自己罗嗦着说了这么多,真的希望能够给大家一些帮助。其实,转行数据分析的文章,大家估计也是看了不少,但是有时可能是缺少一些鼓励,心里总是有些恐慌,不知道自己这样是不是可行的。朋友们,想信我,只要按照自己学习就可以了,那一天肯定会到来的。(PS:如果大家需要鼓励,还要再了解下我的情况的话,可发私信加我微信,如果你方便的话,我会语音解答你的疑问。)

八:数据分析工作一年后的感受

想想自己工作快一年的时间了,再来更新下自己的工作情况和一些感受,给找工作的同学们一个参考。
1: 自己的工作情况

去年12月份的时候,自己由于巧合和贵人的帮助入职算法职位工作,由于部门服务的客户主要是在非互联网行业(工业行业、零售行业、地产行业等),这些客户也是想使用算法为自己的公司创造利润或是节省成本,可是他们自己大多不明白他们的需求是什么,然后我们算法小组竭尽全力找到他们的需求,给客户展示,客户嘴上说还是挺好的,但也一直张望行业中有没有真正的落地案例,于是这样自己一直没有做过真正的项目。

对于上面自己的这段经历,自己的理解是,自从"人工智能"这个名词火了之后,很多现有公司和刚起步的公司都指望能够通过人工智能创造价值,于是纷纷成立算法部门,可是领导也不清楚算法是什么东西,到底怎么样落地,大概是认为看先搞搞,能搞出来的话就是赚的。
(这里给转行的朋友建议是,如果是刚接触数据不久,私下做了几个开源项目,然后就找到了算法工作,这样的工作可能多半是不靠谱的,或许只是领导跟风,但互联网大厂是绝对可以的)

然后根据自身的优劣势进行了调整,由于自己是本科学历,如果是一直只求算法的路线的话,和研究生比起来优势不大。所以,自己重新做了规划,从事数据工程(ETL、BI)或是高级数据分析,把算法当作自己的一个额外技能,增加优势。于是,现在自己开始了新的工作ETL、BI(公司没有细分这两个职位)
2: 给转行的朋友一些建议

(1): 不要被‘人工智能’,‘大数据分析’这些词汇给忽悠了,不要听信培训机构的学习3-6个月,年薪30万+
(2) 针对不同情况的同学给一些建议
a: 专业和编程、数据没有一点关系的同学,应该暂时先给自己定位到数据分析职位上,如果数据库知识学习的比较好的话,可以考虑数据工程方向
b: 专业或工作和编程、数据有些关系(比如java开发之类的),或是计算机专业的同学不想做开发,做做数据工程也是挺好的。
c: 数学功底比较扎实的同学(最好是硕士),可以先考虑下数据挖掘
上面的这些自己仅是抛砖引玉,认为秦璐老师说得比较详细
数据分析职业规划

---------------以下主要记录关于转行数据职业的思考和行动-------------------

九:成立数据蛙每周交作业小组(更新于2018年12月11日)

2017年12月8日,做了第一份数据工作-----数据挖掘,后来和转行数据分析的同学组件讨论群,不知不觉中都有242人了。群内成员虽来自各行各业、各个年龄段,但他们大都有一个共同特点就是-------经过自己的努力,从真正的零基础找到了数据类的工作,现在有不少同学已经在平安、饿了么等大公司担任数据类职位,看到身边这么多优秀的朋友,真的是特别开心。真的是,把时间种在哪里,哪里就会开花结果,试想时间可曾辜负过谁呢?
2019年马上要到了,先立一个flag,新的一年将是和群内同学疯狂成长的一年。和同学们讨论了许多如何让社群能够有更好发展的问题,综合大家的建议,得出结论是------组建数据蛙每周交作业小组
具体的门口右转
零基础入门数据分析成员的新年计划

十:做我们自己的博客网站(更新2018年12月30日)

(一):做属于我们自己的博客网站

社群同学提议想做一次分析简书钻活动的效果实际项目,可是没有办法得到分析所需要的数据,所以就萌生了建设一个网站的想法。其实,很多同学也提议,网上虽然有不少的数据,但是不知道怎么去分析,究其原因是大家没有切实接触到业务,这确实对于转行同学是一个很大的困扰:那么现在我们做的是:(1)选取大家在简书作业中的优秀文章,我们一起来做推广,在博客网站上产生了点击流数据,大家来做分析,修改文章,修改推广方式,接着再分析,一直迭代下去,不断优化,这样下来不仅练习了数据分析还练习了运营的能力。
1. 网站已经完成内容:
(1) 网站基本功能已经具有
(2) 博客网站板块已经定好,分为:python 、SQL 、统计学、实战、业务知识,其中实战博客主要内容:
(a)大家做的开源项目
(b)推广大家的文章,在博客上产生的点击流数据让大家实实在在的做数据分析
2:即将开始的内容
(1)开始购买服务器和配置环境
(2) 前端埋点
(3)小型数据仓库的搭建
(4)增加文章内容

(二):成立了专门为转行同学服务的团队

成立了服务小组,专门解答新同学学习规划上的疑问。(重点:自愿为大家服务

  • 制定专属于你的学习计划和职业规划
  • 群中300多人来和一起讨论你解决学习中碰到的问题。
  • 制定好计划之后,和大家一起每周交作业,并且能够通过爬虫监督大家的作业情况
  • 还有群内同学发的内推机会

十一:开始第二期数据蛙强化课程(更新2019年2月18日)

开始强化课程的缘由,是同学们提出这样的问题:
1: 面对网上一堆课程,没有学习计划,制定了学习计划可总是无法坚持下来。

2: 面对很多的培训班,不知道是真是假,并且动不动就是3000+ 或者上万。

所以想针对快速入门学习的,并在3个月后找到数据分析工作,制定了3个月学习计划。由于自己做助教近一年的时间,所以想了,与其让大家去其他机构,在机构中我带大家学习,不如在我们自己的社群里进行呢。

计划做个三个月的强化辅导,这三个月我和蓝毅同学(蓝毅同学有过培训的经历,他的体会是机构中会教很多的东西,但是每一个都不深入,工作中也不一定用的着,花的钱还多)全程服务大家,定于下2019年1月7日开始(根据市场对大家的技能要求,强化课程下架,重新开发了基于工作场景的案例)

十二:给想报线下培训同学一些建议(更新于2019年2月18日)

介绍一篇小组成员(蓝老哥)用时6个月,花费19880元在培训班学习的经历文章。大家一起来看看他是如何从报名开始并找到工作,这中间的走过的路和犯的一些错误---------培训班转行数据分析

十三:上线修改简历的服务(更新2019年3月9日)

金三银四,小伙伴们都开始了找工作,但是看了几十份大家的简历,不仅是不合格,并且在投简历的时候肯定会吃大亏,人家HR可能都不会看这样的简历。为了大家带来帮助,所以会为大家服务两周时间。

服务内容:

  • 指导修改简历
  • 帮助从其过往的工作经历中找到数据分析相关经验

大家要准备的内容是,先阅读为大家准备一份数据分析师简历的清单,根据这篇文章大家先做一个简单的修改

十四:关于19年转行数据分析的一些思考(更新2019年6月23日)

今年一直在关注社群小伙伴们找工作的事情,从一开始简历投出没有人来问的焦灼,到面试时自己答不出问题的尴尬,到后来找到工作时间的喜悦。这期间有不少同学是走了弯路,现在数据分析工作也是刚刚兴起没有多久的职位,很多公司的要求都不太相同,而且随着时间变化要求也在相应的变化。根据和同学们的聊天和自己面试的情况,总结了19年转行数据分析应该注意内容

推荐 0
本文由 DataFrog 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册