P7数据分析的Offer,你准备好了吗?

浏览: 495

作者:李宁 :著《数据化运营:系统方法与实践案例》书籍,现于某知名外卖订餐平台担任数据专家,先后于艾瑞、携程从事数据相关工作。

个人微信公众号数据自由之路(微信ID:dataFreeLife)




题记

电影背景:「Facing the Gaint」(面对巨人)关于美国橄榄球队的励志电影。Guerrant(葛兰特)作为中学球队教练工作生活均不顺心,向priest(神父)倾诉自己的遭遇,神父对答如下

--priest(神父):Guerrant,I heard a story about two farmers who desperately needed rain and both of them prayed for the rain.But only one of them went out to the field and prepared for the rain.Which one do you think God will send the rain?#我有一个关于农夫求雨的故事,两个人向上天祈求下雨,但只有一个人到田地上为下雨做准备。如果你是God,你认为哪个更有可能成真

--Guerrant(葛兰特):To the one who gets prepared#做好准备的那个人。

--priest(神父): Which one are you ?#那你是其中的哪一个?(是不是做好准备的那一个?)

「吸引力法则」也指出,如果要实现一个愿望,你需要全然相信地去做好准备来迎接。反观自己,从营销转行做数据,两年半的时间做到P7,原因就是自己一直在做准备。

文章缘起:作者与2017年8月先后面试几家公司P7级别的数据分析师,分别是平安银行,饿了么和小红书(另有简历关已过但没有精力去聊的部分10亿美金以上的公司。最后拿到饿了么P7的offer(收入对标阿里P7)。作为营销转型数据仅有两年半的人,我一直在思考能获得offer的原因。


首先这些公司的P7岗位应该是宁缺毋滥的,因为同期竞争者的不足而胜出的概率比较低。那我需要反思我为什么准备好接受这样的offer?


面试问题很套路:

  1. 你自己的经历是什么?你想通过经历来表达什么?你自己举一个案例来说明自己?

  2. 你的数据分析能力如何,举个例子你来分析一下?

  3. 你未来想要做什么,你从现在公司离开的原因是什么,你选择我们公司的原因是什么?

  4. 你还有什么问题?

面试是否能抱佛脚:你可以举多种多样的例子并且自圆其说,你需要表现出来你对行业的理解和自身的认知,散发的气质是对行业有很长期思考,跳槽是深入而谨慎的决定。能做到这样的气场,面试者能感受到“influence”(译为“影响”,不是气场压制,是一种频率接近的认同)。如果你的内容是虚的,面试官能感受到(就像如果你在知乎上pretend资深,总有比你更nb的人指出破绽)。

此文是不是面经?:这篇文章不是面经,因为不直接告诉提前一天/一周怎么准备(我认为对于正常人来讲,临时抱佛脚准备是很难逃过面试官法眼的);这篇文章是一篇经验,是对于职业生涯的每天对自己反省的一种参考。

面试的底气来自哪里?:这种气质来源于你对经典问题的思考:你是谁,从哪里来,到哪里去的问题?

我是一个从营销转型数据的人,希望从数据中发现价值的人,数据因为有我而产生价值(没有我可能就没有产生价值,类似ABTest)。这个理念我一直在坚守,从乙方到甲方是是因为看到很多case不能落地,从携程->饿了么是因为发现数据驱动产品更适合PM来做,而不是数据分析师,所以我会继续从算法角度来强化自己传统分析能力,在多产品和多sku的场景下实现分析的突破。

我是怎么做到的?能将这个问题回答到自己心安理得,在于我怀着探索的心念,不断通过试错的方式理解行业是什么,了解哪个位置是适合自己,应该在什么方向上努力。所以表面上我做了很多很杂的事情,但真实是一直在寻找自己的定位和未来的方向:整个坐标系是什么,我的xy坐标参数是多少,未来的路要继续怎么走,如何做可以朝预想的地方走?

下面我把对于传统数据分析/BI的理解陈述如下,读者可以参考这个坐标系来更新自己的位置,思考未来适合哪个岗位。当思考有进步,你会在和别人沟通的时候,通过对方的反应来感受到不同。(如果对话者是面试官,那获得offer还会远吗?)

/ 01 /

数据分析/BI职能の发展演变 

BI职能:随着企业对数据的需求(通常与企业的发展阶段关联)变化而不断演变,即分工越来越细、专业化越来越明显。就成熟企业的应用来看,BI职能可以分为数据储存、报表制作和数据分析,具体团队会因职能不同而在此基础上继续细分,但根据三个职能设置三个团队是比较常见的。

  • 数据分析:非固定及专项分析/ABtest分析,自助平台的建立及推广,对业务方自助分析的培训

  • 报表制作:将常规需求固化为报表,来源可以为业务方提需求和分析师沉淀。

  • 数据仓库:原始数据处理(收集/清洗/制作中间表)、数据平台选型及维护、数据库存储规划、指标统一管理。

初创阶段:

  • 表现:业务方的需求都通过简单的ETL和sql来获取,报表体系不完整,能保证重大项目有数据,但可能因数据获取复杂度高、指标模糊、数据不稳定,使用程度不高。(可能借用第三方工具来弥补)

  • 场景/原因:多见于初创公司(天使轮、AB轮),公司在探索业务模型的可行性,只要在少花钱的情况下、简单粗暴拿到数据即OK。

快速发展:

  • 表现:业务方需求量暴增,需要把常规需求固化报表,临时/专项需求由分析团队来支持,专业的人做专业的事情,提升分析效率。

  • 场景/原因:多见于CD轮后公司,公司验证商业模型后开始复制扩张,拿到投资进行投入,数据软硬件人才,麻雀虽小五脏俱全。

成熟数据运营:

  • 表现:BI几十人支持公司几百上千人的需求,需要继续细化分工、修炼内功,BI变得更加专业,制定规范,比如元数据字典、ETL优化、报表规范等,同时输出分析方法和分析工具,鼓励业务方自助分析。

  • 场景/原因:多见于独角兽以上的公司,竞争格局初定,难以通过简单粗暴来继续增长,需要从数据中发现问题发现趋势,谁能用有限的资源投入更精准、效率更高,谁就有可能胜出。这时候数据作用凸显,公司也愿意投入资源来做数据。

上述所述为一般情况,也会存在数据部门在初创公司按照大体量来建设的思路(比如盒马鲜生就高举高打)。了解世界的目的是来看自己的相对位置。

/ 02 /

数据分析 

数据分析,本质是”分析“,只不过用数据来辅助证明。分析的思路是最重要的。这其实是一种传承西方的思维逻辑方法(中国人多感性思维),逻辑思维分析的方法是,”现象-差别-差别的扩大-精确量化-创新“,数据分析的常用思路可以总结为” 常态->现实与常态有gap-> gap的扩大->分析原因->新常态"。具体来说,在实际工作中,分析步骤还需要结合场景来理解,从业务中来到业务中去

分析的步骤:

  1. 定义问题:希望解决什么问题?这个问题具体是从哪些报表的哪些指标上发现的,这个指标波动是不是正常?如果有时候业务方不清楚这个指标波动1%是不是正常,可能会把正常错认为是异常。

  2. 大胆假设:明确问题之后,需要跟业务方了解最新业务变动,有没有上线最新政策或新活动,结合业务来做可能性推测。

  3. 小心求证:用数据来验证这些假设是否成立、是否具有统计意义。

  4. 输出结论:数据要结合场景解释给业务方。

最考验初级和资深分析师的环节是2、3步骤,初级分析师可能需要穷尽业务场景,一一验证得出结果;而资深分析师会根据常用数据和历史项目经验,做初步筛选出最可能几个,稍加验证即可得出结论。对于毫无头绪的问题,无论是资深还是初级,都会需要经过由“特殊->一般->特殊"的过程,即先看一些个体的日志寻找灵感,然后取验证是否具有统计意义,再将这些统计意义扩展到全样本。

分析人员的核心技能:

  • 数据sense:理解指标,一个是常见问题可以用哪些指标来验证和解释,二个是数据指标计算的理解,在跨部门跨业务的时候(比如业务口径和财务口径),利用不同的数据库表,同一指标可能意思不同哦。

  • 业务/商业sense:把业务问题转化为可以用数据来解释的问题,同时数据结果也可以结合业务场景用简洁的语言解释清楚。、

  • SQL工具:各个常见平台hive / mysql / sqlserver / presto的sql取数。

  • 主动性:优秀的分析师不仅是被动响应需求,如果主动通过数据来发现问题来指导优化,会非常受人喜欢。这样的分析师不仅需要怀着主动的心态,同时需要有一些问题在脑中思考,才会在合适的时机迸发闪光点。可能表面上是某个分析师一直能“偶然”发现有价值的问题,但其实TA一直思考用心的结果。

  • 逻辑思维

关于数据分析师的职能和收入的关系,可参考文章:月薪20K的数据分析师都在做什么?

/ 03 /

报表制作 

报表工作:

  1. 输出报表:来源为业务方提需求和分析师主动沉淀。

报表人员的核心技能:

  • 可视化:既满足业务人员的指标需求,同时站在数据专业的角度来优化指标及投入资源,给出合理的建议。报表的初衷是希望业务方自助分析,好的报表易读易理解,即复杂的数据/业务场景用简洁的指标来展示,不需要业务方线下再反复沟通指标释义。

  • 结构化思维:根据业务需求来规划报表体系,在满足需求的情况下利用最少的数据资源(包括调度任务数量和后期维护成本)来把事情做好。

  • sql能力:减少bug,增加可读性,方便其他人维护。

/ 04 /

数据仓库/平台搭建

数据仓库工作:

  1. 平台选型:符合业务特点的数据应用平台

  2. ETL数据流:原始数据的收集、清洗(比如去爬虫)、数据落库,对调度流程生成监控指标,保证调度流程的稳定高效。

  3. 制作宽表:减少后期分析的join次数。

  4. 元字典管理:数据规整,保持各个事业部采用的数据底层指标统一,计算逻辑一致。

数据仓库人员的核心技能:

  • 底层性能熟练:对各种数据库/数据平台的性能指标(如I/O、吞吐量、QPS)比较清楚,针对数据的时效性和量级来做不同聚合、落不同的库,能够利用专业知识来达到最少的投入和维护来满足数据需求。现在各个公司都开始有保存数据的意识(先存着、以后可能有用),所以对于大公司踩过很多坑交过很多学费的资深数据仓库工程师非常抢手,因为他们能够帮助公司少走很多弯路,而他们省下的钱的1/10也成为年薪收入。

  • 对业务场景的理解:确定哪些指标进入宽表,以及在指标统一的时候如何折衷balance。

后记

能理解之后还需要自己在实践中取不断尝试,这份知识才会成为你的经验。就像任何学习过程一样,知易行难。如何能把这个阶段坚持下来,分享一段「面对巨人」的教练激发队员潜能的片段。

背景:这支校队在联盟赛中屡战屡败(无论对手强或弱),优秀队员因为前途(球队获奖可以有机会拿到进名校的体育全奖名额)而离开,在一次赛前训练中,队长也表现出不可能获胜的态度。教练让他蒙上眼睛来做death crawl (死亡爬行),在正常训练30米(最多50米) 的情况下,教练激励队长完成爬行整个球场120yard(109米)。下面是爬行完后教练和队长的对话:


--captain(队长):It got to be 50. It got to be 50. I can't move anymore.#50yard一定到了,我已经用尽全力了。(教练开始给他50yard的目标)

--Coach(教练):Look,Brook。 You are in the inzone.# 布洛克,其实你成功穿越整个球场(110yard,远超过50),you made it!

--Coach(教练):Brook. You are the most influenced player on this team, if you  walk around defeated and so will they. Tell me if you can't give me more than what I have been seeing it .You just carried 140 pounds' man across the whole field on your arms.#布洛克,你是队中最有影响力的球员,如果你都在犹豫、害怕失败,那整个球队就没希望了。(完成这次120yard的mission impossible)你还会对自己没有信心吗?要知道,你是可以背着140磅的球员穿越了整个球场的人(相信自己的潜力)。

--Coach(教练):Brock,I need you! God gives you the ability of leadership, don't waste it! Can I count on you ? #布洛克,我需要你(重振士气),既然上天给你leader的天赋,不要浪费才华!

--captain(队长): Yes.


没有什么是不可以的(nothing is impossible --李宁),但是人毕竟是人,也会有被眼前困难挫折到伤心失落的时候,经典电影的经典桥段可以帮助你再次发现生命是有无限潜力的。我在很多事情想不通的时候,会再看一遍list中的电影,虽然不会马上有新灵感,但是会提醒我不忘初心,再次有相信自己的勇气。


共勉。

- END -


往期精彩

■ 如何理解马云演讲「十年后没有数据分析师的职业」

■ 用数据分析告诉你数据分析师能挣多少钱?

■ 月薪20K的数据分析师都在做什么?

■ 营销转数据,两年半到P7,我都做了哪些事儿?

■ 给30个PM拉了一年sql,我学到了什么

公众号后台回复关键词学习

回复 免费                获取免费课程

回复 直播                获取系列直播课

回复 Python           1小时破冰入门Python

回复 人工智能         从零入门人工智能

回复 深度学习         手把手教你用Python深度学习

回复 机器学习         小白学数据挖掘与机器学习

回复 贝叶斯算法      贝叶斯与新闻分类实战

回复 数据分析师      数据分析师八大能力培养

回复 自然语言处理  自然语言处理之AI深度学习

推荐 0
本文由 人工智能爱好者社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册