如何确定你的研究对象的特征呢?说说基本的方法和思路?比如说你要去挖掘分析一个你不熟悉的的行业。

0
已邀请:
0

天善小编 - 微信直播问题收集 2015-11-22 回答

汪尚:企业用户标签的建立分三种,第一是基本标签,如年龄、性别,第二是统计标签,比如消费金额、消费频次等,第三是预测标签,如流失概率、客户偏好等。三种标签的建设分三个步骤完成。
首先是两个方向,第一是以数据驱动,从表中提炼,第二是业务驱动,从业务角度想你需要什么标签。第二种如何以业务驱动,这个比较笼统,业务不同也就不一样,但是大致做法就是做业务分析,看看从业务决策上看需要什么信息,多方访谈,主要说第一种,从表中获取,分三个步骤,第一,从表中体现用户基本信息(如果是建用户标签库的话),这个简单,都能理解,第二,梳理表的业务,派生统计指标,常用度数值型有求和、平均、最大、最小以及比例,对于分类型的计算众数,频数等,具体也要业务和经验多想。第三,是面向分析主题见预测模型,进而获得预测指标。这是基本思路。
悟:流失概率,如何得到?
汪尚:流失概率,就是首先定义了流失目标字段,然后派生影响指标,然后建立分类预测模型得到相应概率。
面包君:这也是我们在做不同的场景推荐的时候,需要思考的问题。
1.结合自身已有的数据,比如我就只知道你叫什么,我怎么去分析你的星座啊;
2.结合业务和经验,比如我们在做阿里天池大赛、kaggle,我们自己会发明一些时间滑窗方法、数据离散等等。

要回复问题请先登录注册