婷婷糖的数据格子

婷婷糖的数据格子,分享婷婷糖在数据挖掘这条道路上行进时的心得和感悟~

4
推荐
3464
阅读

数据挖掘4流程(R vs python)

  数据挖掘从开始到结束主要分为6个步骤:业务理解、数据搜集、数据整理、数据建模、模型评估以及模型部署。抛开将业务转化为模型的业务理解以及对建立好的模型的模型部署两部分,本文将对建模过程当中的核心4步骤:数据搜集、数据整理、数据建模、模型评估进行归纳和整理。每一部分,笔者都会从三个角度进行归纳:1....

发表了文章 • 2017-12-19 17:36 • 3 条评论

5
推荐
4889
阅读

关联规则R语言实战(Apriori算法)

  最近遇到一个业务问题需要用关联规则的算法来实现,为了解决业务问题,我又重新复习了一遍以前就学过的Apriori算法并将其运用到业务场景中。下面,我想谈一谈在具体的业务实现过程中我的一些感想。   一.理论背景1.1基本术语定义    X和Y各代表某一个项集,M代表样本中的总项集数。1.2关联规则的三个度量 ...

发表了文章 • 2017-08-05 20:34 • 3 条评论