问题:为什么要用哑变量处理?哑变量与正常变量的区别是什么?什么时候用哑变量比较恰当?

0
已邀请:
0

谢佳标 - 微软中国MVP,多届中国R语言大会演讲嘉宾。 从事数据挖掘建模工作已有10年, 曾经从事过咨询、电商、电购、电力、游戏、金融等行业,了解不同领域的数据特点。 有丰富的利用R语言进行数据挖掘实战经验。 合著《R语言与数据挖掘》及《数据实践之美》等书籍,均在京东有卖。此外《R语言游戏数据分析与挖掘》预计将在2017年上半年出版。 2016-08-20 回答

有时候我们做相关性分析、线性回归模型时,会要求变量(自变量)为数值型变量,此时我们需要将因子型变量转换成数值型变量,即进行哑变量的虚拟化处理,衍生出新的数值型变量再去做下一步的研究。

要回复问题请先登录注册