【用户画像系列】用户建模

浏览: 3661

为了满足用户的个性化需求,需要对用户画像进行建模,从而为行为分析习惯、兴趣偏好等重要的商业信息,提供大量的基础数据。

1用户画像建模的核心

是对用户潜在的意图和兴趣进行表示和存储,根据用户的基础信息、产品信息、访问信息、行为偏好、以及隐式兴趣等归纳出可读取、可计算的用户模型。一般来说,用户建模就是将用户信息标签化,标签化的含义是矩阵中的特征值,用户建模的过程就是将用户信息矩阵化,然后再找出特征值。

2用户的定量数据

用户画像可以归纳为定量数据和定性数据,定量数据相比定性数据要简单在定量的用户画像建模过程中,需要考虑用户的维度,也叫颗粒度,颗粒度越小,用户刻画就越精准,当然,过犹不及,如果颗粒度越小就要求获取用户越细化用户数据,这会导致获取用户信息的成本增加,而且还会导致用户画像的适配性降低,因此,做用户画像之前,分析师们是要提前做好预设的,在没有数据的时候,这一步的完成可以依靠问卷调查的方法,了解用户的使用场景,关注内容等等,然后以此为基础设计用户画像,对把握颗粒度有一定的参考意义。

确定了用户的颗粒度,就可以通过问卷、访谈或者技术手段来获取用户行为,存储和分析用户数据,获得定量的用户画像。

1、问卷、访谈的形式

是相对直接的手段,通过这种方式,我们可以直接的获取真实的信息,无须过多的建模预测,更多的是处理数据的缺失值、异常值等基础的数据预处理工作。


2、采用技术手段

属于隐式的数据获取方式,进一步的通过统计、规约、分析等方式获取用户画像数据,但是这种方式准确性比较低,但是较显性获取方式,隐性获取方式更容易,样本也会更大,更具有普世性。如何提高隐性方式的准确度呢,一方面是大量用户数据的收集与挖掘,一方面是干脆就将隐性数据当成显性数据的补充。无论是问卷、访谈,还是技术手段的的数据分析,都要进行效度和信度的论证,以保证数据尽可能准确可用。


仅仅依靠定量化的用户画像无法全面、精准地刻画用户:数字无法描述用户某些属性,如用户的兴趣模型,你就很难去评估他对一个内容的的兴趣模型,以及其会随着时间变化而发生怎样的转变。


3用户的定性画像

首先我们要先来看一下用户标签,标签通常是人工定义的高度精炼的特征标识,如年龄段标签(儿童、青年),地域标签(北京、上海)。语义化和短文本是标签呈现出的两个重要特征,其中语义化特征赋予标签一定的含义,使人能够容易理解这些标签;短文本特征使标签本身无需再做过多的文本分析等预处理工作,这也方便了计算机的标签提取、聚合分析过程。

4标签化是用户画像的核心

标签化的用户画像既方便人们理解,又方便计算机分析和程序处理。计算机很笨的(估计马上就不是了),标签化之后,计算机才可以自动完成分类统计功能,例如,可以统计喜欢科幻类型的电影的用户有多少,男女比例。其次,计算机也可以根据这些标签进行深度挖掘。例如,可以利用关联规则计算用户年龄和喜欢电影类型的关系,还可以利用聚类算法分析喜欢科幻类型电影用户的年龄分布情况,将标签信息与用户视频浏览、点播行为数据相结合,就进一步的预测用户的喜好,这对于搜索引擎,广告投放等应用领域,都有着显著的意义。

既然标签化对于用户定性画像有如此重要的作用,那么用户定性画像建模中就有必要考虑以下几个问题:

1、  如何定义和表示标签?包括标签名称、标签类别、标签值的取值范围等。

2、  如何解释标签?主要是对标签的语义信息进行描述,从语义上给出标签的解释。

3、  如何推理标签?主要是定义相应的推理规则,从而实现标签之间的推理。

4、  如何验证标签?包括标签的定义是否合理,标签关系是否一致、正确等。

给用户添加标签的工作还是人工整理方式为主。例如:可以通过分析用户行为,给用户添加标签,其本质是将用户行为看成一个事件,事件的判断是比较难的,通常描述为:什么人,在什么时间,什么地点,做了什么事情。收集用户信息是需要有标识,互联网常用用户表示方法如图:


在使用标签标识用户定性画像的基础上,还可以进行用户调研,根据目标、行为和观点的差异,将用户区分为不同的类型,在每种类型中抽取出典型特征。例如,一些个人基本信息,家庭、工作、生活环境描述,赋予一个名字、一张照片、场景等描述,就形成了一个典型用户画像。人物角色一般会包含与产品使用相关的具体情境、用户目标或产品使用行为描述等。为了让用户画像容易记忆,可以用具体的名字、标志性语言、几条简单的关键特征进行描述。一个产品通常设计3-6个标签代表所有的用户群体。

可以看出,标签是用户定性画像的基础,如何表示、解释、推理、验证标签是用户定性画像建模的关键。

目前基于标签的用户定性画像方法更多的关注标签的获取,在标签的语义解释和推理方面比较薄弱。为了解决这一问题,通常会使用基于知识的用户定性画像分析,这里将引入本体论的知识去表示、解释和推理等。

下一次我们来具体看一下如何实现的过程,拜拜哒


推荐 1
本文由 菜鸟数据岛 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册