打好基础再炫技,不然面试过不去。分析师需重视数据来源

浏览: 4550

完整的面试指导。戳{求职必胜,提高面试成功率的靠谱攻略}

新人面试常范的错误。戳{拒绝贱卖,我要加薪}


从一场面试事故看基本功重要性

 

本周,陈老师把一个面试者问崩溃了。

事由是,隔壁组的领导想找一个有较强分析能力的高级策划。

对我说:“老陈,这个第一眼看还行,分析能力这块你把把关”

我就随便问了问,他就崩了 ╮(╯_╰)╭

 

 

我看他带了分析报告,就让他讲一下思路

他涛涛不绝的讲完,我把手指向第二页:

“就这里,这个数据,男女比例,这个数哪里来的?”

他愣了一下,回答:“这个是360大数据啊,我标注了的”

 

 

陈老师说:“360大数据是吧……”

“360平台是怎么收集这个大数据的?”

“360用户覆盖率是多少?”

“没有覆盖到的是否会影响结果?”

“360如何知道用户就是男的?他有审核流程吗?”

“拿到外部数据以后,你是否有内部数据进行验证?”

“OK,你口头说进行了,那你们内部数据是怎么收集的?”

“内部收集完男女后是否有验证?”

“没有验证这个指标的准确度有多少?”

“没有准确度为什么敢用在用户画里并且作为决策重要依据?”

……

 

 

KO

 

 

事后隔壁组领导总结道:“恩,看来这个人是见过一些高大上的报告,但是没有自己实操过。”

“恩恩,这是您自己说的哈,我只是单纯和他探讨一下为什么报告要放这个数”——陈老师无辜的说

 

 

菜鸟谈模型,老手谈质量

 

在部队有句话,叫:新兵怕炮弹,老兵怕机枪。

新兵们见到个大的,动静大的家伙就害怕。

只有老兵知道,上了战场要你命的是那些小到看不见的子弹。

 

 

数据分析领域也是这样:

吃瓜群众知道的是啤酒尿布,麦肯锡方法,波士顿矩阵,好高深,好有深度;

刚入门的爱好者最爱争论大数据的定义,问工作中用什么模型,收藏一堆深度学习的文章;

老鸟们交流经验,第一句都是:你们的数据在什么地方采集的

因为老鸟们知道:长袖善舞,多钱善贾,数据质量越好,能做的分析越多。

如果连数据质量都保证不了,就别谈什么建模分析类的

 

 

完善的系统 + 清晰的流程 = 好数据

 

以银行信用卡业务为例:

事前有目标:比如车主卡要求驾驶证,白领要求工牌照,企业主要求营业执照。

事后有审查:不但会审核资料,而且会进行电话复查。

流程有考核:业务员提供的申请表如连续出现数据问题,数据不规范,直接扣工资!

系统有支撑:所有数据在后台集中保存集中管理。

 

 

在这套流程支持下,客户信息,特别是白金卡以上高端客户的信息有着相当的准确度,特别是陈老师待过的XX银行,这种很重视信用卡业务的行,要求格外严格,使得数据质量格外好,能做的分析,能建的模型相当多。

 

 

差的数据吗,想想你的毕业论文

 

特别是本科毕业论文,谁做谁知道O(_)O

 

是不是很多人都从统计年鉴随便捞点什么数回归,相关一下:

是不是很多人出过这种问卷:“您对公共行业服务的满意程度如何,1-10分,10分是满分”

是不是很多人把问卷发到问卷星然后各个群转发求填写

转发的群包括但不限于:LOL战队群,单身狗交流群,小初高同学们,……

 

最后出来的数据一塌糊涂自己都搞不懂

胆大的直接做个百分比画个饼图条图贴上去,管他合不合理

胆小但有节操的做加权,做平滑,做归一,合理的改数据

胆小但没节操的直接手动改数据,有能耐的改原始问卷,没能耐的改输出模型的参数

 

反正只要指导老师不戳破就没关系,都是这么想的,是吧o(>﹏<)o

 

前线的销售也是这么想的!

门店的营业员也是这么想的!

APP的终端用户也是这么想的!

只要企业没人主动戳破就关系,哈哈

 

 

因此缺少流程的管理,缺少好的APP设计,太过功利的或者生硬的收集数据的时候

就会出现一系列的问题,比如:

  • 业务员图省事,客户基本资料不填,瞎填,故意填错(客户是我的,不是公司的,哼)
  • 门店为了套取优惠,自己办几张会员卡,促销来了全部刷到这几张卡里
  • APP用户反复注册,套取新手补贴,七姑八姨手机全部来一下
  • APP,微信数据没有打通,明明一个用户,在微信和App有两套数据

……

所以啊,在讨论数据的时候一定要了解数据来源与流程,知道潜在问题。

 

 

想要面试不被问倒,至少要清晰最基础数据来源

 

来源1

来源1:业务员/门店/经销商/客服/服务中心/用户手动填写

来源场景:一般会员注册的资料都是这么来的,线下渠道的是业务员填,网站/APP的是用户自己填

典型问题:没有严格的管理,没有事后审核,随意填,瞎填,空白

 

注意事项:

l  这是数据最容易出问题的地方。

l  最好亲自走一趟流程,以一个真实用户的身份体验一下,看看是否存在漏洞,看看自己愿意填什么不愿填什么。

l  自己走过流程以后,就知道报告上能不能放:男女比例这种看似简单实则大坑的东西。

 

 

来源2

来源2:POS机/网站/APP的交易记录

来源场景: 用户购买交易

典型问题:

l  买单没有要求出示会员卡,导致交易记录不能匹配用户

l  促销活动影响,导致拆单,拼单,大量新用户涌出……

l  数据没打通,不同平台记录混乱

 

注意事项:

l  交易数据是所有数据里相对真实的,毕竟涉及到钱

l  但是会受政策的影响比较大,被人为改变形态

l  第一要了解企业的交易流程(最好自己亲自买一遍)看看数据收集了哪些

l  第二要经常收集企业的信息,了解市场上可能对交易影响较大的事件

 

 

来源3

来源3:网站/APP的互动行为

来源场景:用户在自己APP/网站/服务号互动行为,第三方平台发布的数据

典型问题:

压根没收集,常见于刚开始电商化的传统企业

数据采集不全,只有整体统计,不能具体到用户

数据本身有偏,没有一个第三方平台能包打天下,因此数据总是有偏的

 

注意事项:

l  互动数据与运营紧密挂钩,使用互动数据需结合运营场景(拉新/促活/保留)。

l  第三方平台的数据要和内部对应的数据做对比和匹配,不能乱用,不能全信。

 

 

来源4

来源4:街头访问/定点访问/网络访问/电话访问的调研问卷

来源场景:各种报告,公开的,企业内部的

典型问题:一大堆o(╯□╰)o

抽样,投放渠道,受访对象,问卷结构,问法,是否有测试,是否有复审……

 

 

注意事项:

l  调研问卷是获得数据最简单廉价的方式,在网上出几个选项勾一下不是啥难事。

l  因为来的太廉价所以会有各种问题,数都数不完

l  因此,网上的来路不明的调研报告不要随便信,不要随便用

l  引用调研报告一定要讲清楚这个调研是什么目的,在什么范围内做的

l  调研是一种传统但不是很适合大量样本的方法,范围越小,目的越聚焦,成果越好

l  调研的问题越聚焦,越容易量化,成果越好

l  所以那些“你幸福吗”的调研结果大家乐乐也就过去了。^_^

 

 

以上,请大家参照自己企业情况,自行了解。

回归到主题,在面试的时候,第一顺位要展示的是自己是一个靠谱的干活的人。

因此不要急着炫耀自己的技能多牛,打好基础,不要光顾着吹吹漏了都不知道。


当职业发展遭遇迷茫,戳:{大数据职业规划}

最新文章,可关注陈老师公众号:接地气学堂





作者介绍:陈老师,在咨询行业打拼了9年,在如何诊断经营问题、建立分析体系、解决专项问题上有超过30个大型项目积累与实战,天善智能特邀专家。


数据分析职场路上有困扰吗?不妨到《数据分析师八大能力培养课程https://edu.hellobi.com/course/272 里聊聊!

视频课程特色:

从真实数据分析工作场景出发,训练实战能力

启发式教学+大量实际操练,培养属于自己的能力

不依赖于某个具体技术,也适合对数据分析感兴趣的学生、业务部门人士学习

推荐 15
本文由 陈老师 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

10 个评论

谢谢,收下。先收藏,回头细细品味
厉害 顶d=====( ̄▽ ̄*)b
想问老师,
好基础、好技术跟好人品、好套路,哪个更重要啊
^_^
陈老师的问题确实比较基础的。
然而就把他问死了,额,真的不是故意的,哈哈
好技术,哈哈
O(∩_∩)O
转起来。
谢谢陈老师,QQ群看到,来顶下。
想象一下那个场景,被问得说不上话,好炕

要回复文章请先登录注册