0
推荐
2603
阅读

SAS数据挖掘实战篇【四】

坚持每天学习!坚持每天创新!并应用到实际中去!好了,今天主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。1 聚类分析介绍1.1 基本概念聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作聚类。处于相...

发表了文章 • 2015-11-01 19:08 • 0 条评论

1
推荐
2273
阅读

[转载]在SAS中进行数据挖掘之关联规则

由于在Excel中进行数据挖掘的结果存在不确定性(参见《解读数据挖掘之关联规则》一文的最后一段),虽然它具有操作简单的特点,但是为了保险起见,建议还是使用更专业的统计软件来进行数据挖掘。SAS系统被誉为国际上的标准软件系统,本文将详细介绍如何在SAS/EM模块中进行关联规则数据挖掘,使用的软件版本是SAS 9.1.3下...

发表了文章 • 2015-11-01 18:59 • 0 条评论

0
推荐
2527
阅读

[转载]PROC REPORT基础

1 PROC REPORT语法PROC REPORT  data= SAS-data-set  options ;   COLUMNS variable_1 …. variable_n;   DEFINE variable_1;   DEFINE variable_2;  . . . DEFINE variable_n; COMPUTE  blocks   BREAK...

发表了文章 • 2015-10-31 23:31 • 0 条评论

1
推荐
2430
阅读

数据挖掘技术:客户价值分析

使用RFM方法(最近购买日Recency, 各期购买频率Frequency, 各期平均单次购买金额Monetary)能够科学地预测老客户(有交易客户)今后的购买金额,再对销售毛利率、关系营销费用进行推算,就能按年、按季、按月分析出今后几期的客户价值。在这里,客户价值指CRM毛利。CRM毛利 = 购买金额 – 产品成本 – 关系营销费用。RFM方法是...

发表了文章 • 2015-10-31 23:00 • 1 条评论

4
推荐
3313
阅读

数据挖掘,数据分析好书

《深入浅出数据分析》  这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。《啤酒与尿布》  通过案例来说事情,而且是最经典的例子。难易程度:非常易。《数据之美 》  一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和...

发表了文章 • 2015-10-31 22:43 • 2 条评论

1
推荐
2529
阅读

大数据挖掘助力互联网金融风险控制

互联网金融发展的关键是风险控制,“风险控制”已然成为诸多互联网金融企业能否长大的魔咒,这个不争的事实像一座大山摆在众多互联网金融大佬与创业者的面前。为什么阿里金融能够将它的网络小贷不良率控制在不到1%,有胆量再贷多点吗?大数据挖掘技术和互联网金融的风险控制到底是什么关系?互联网金融将怎样建立有效的风...

发表了文章 • 2015-10-31 22:41 • 0 条评论

0
推荐
2381
阅读

SPSS常用函数

SPSS函数       是一个常用程序(rountine),并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称(keywordname),且绝不能写错。通常,函数的格式为:函数名称(自变量,自变量,……),某些函数可能只含有一个自变量,而有些函数则可能含有多个自变量,当一个函数含有多个自变量时,各...

发表了文章 • 2015-10-31 22:19 • 0 条评论

1
推荐
3737
阅读

SAS决策树:信贷风险建模试验

一、 概论决策树通过应用一系列简单的规则建立起对观测数据的分类。决策树对于观测值的分类建立在变量的输入值基础上。每条规则都是在前一条规则形成的层次的基础上对观测数据的进一步划分,而最终建立的划分层次称为决策树,每个划分段称为决策树的一个结点。最初的未进行划分的片段包括所有的观测数据称作决策树的根结...

发表了文章 • 2015-10-31 22:16 • 1 条评论

0
推荐
1768
阅读

《商业银行授信风险管理-以中小企业为视角的实证分析》读书笔记

感谢特拉文童鞋的寄来的书籍,也是想研究研究风险防范控制和信用规则建立这方面的数据挖掘与数据分析研究模型案例,风险控制是商业银行永恒的话题,特别是在金融危机之后,使得企业、银行与商家更多地关注风险管理。中小企业作为数据众多的群体,研究中小企业的融资难问题成了重中之重。中小企业特别是中小企业的授信业...

发表了文章 • 2015-10-31 22:04 • 0 条评论

0
推荐
1878
阅读

线性回归介绍之一

线性回归在所有的统计方法中绝对占有不可忽视的一席之地,其用途之广泛毋庸置疑,更重要的是它是整个回归家族中最为简单、也最容易理解的方法,几乎所有的统计学教材,不管是医学统计还是社会统计抑或经济统计,线性回归绝对会有独立的章节,而其他的回归方法则很少有这种待遇。线性回归大致可分为单因素回归和多因素回...

发表了文章 • 2015-10-31 22:03 • 0 条评论

0
推荐
2226
阅读

电商团购的用户行为分析研究

这几年,电商价格战打得不亦乐乎,而消费者们作为这场游戏中的弱者,不断地被这些真假价格战挑逗着和引导着。然而,在当今的商场上,还有另外一类企业不是通过简单粗暴的价格战,而是通过对数据的充分使用和挖掘而在商战中获胜的。最典型的当属全球电子商务的创始者亚马逊(Amazon.com)了,从 1995 年首创网上售书开始,...

发表了文章 • 2015-10-31 22:02 • 0 条评论

1
推荐
2842
阅读

机器学习的认知和算法总结【仅供参考】

机器学习与数据挖掘相信不少人都没弄明白机器学习和数据挖掘的区别是什么?其实机器学习并不等同于数据挖掘,数据挖掘更多的是从目标角度去理解数据,然后利用算法建模探索有价值的结论;而机器学习更多是从方法角度,以人工智能的角度去认识世界,去掌握知识,实现机器学习。判断是不是真正机器学习,可以从“机器是否具...

发表了文章 • 2015-10-31 15:34 • 0 条评论

0
推荐
2236
阅读

[转载]LDA(Latent Dirichlet Allocation)主题模型算法

LDA整体流程先定义一些字母的含义:文档集合D,topic集合TD中每个文档d看作一个单词序列< w1,w2,...,wn >,wi表示第i个单词,设d有n个单词。(LDA里面称之为word bag,实际上每个单词的出现位置对LDA算法无影响)D中涉及的所有不同单词组成一个大集合VOCABULARY(简称VOC)LDA以文档集合D作为输入(会有切词,去停...

发表了文章 • 2015-10-31 15:30 • 0 条评论

0
推荐
3038
阅读

线性判别分析(Linear Discriminant Analysis, LDA)算法分析

一. LDA算法概述:线性判别式分析(Linear Discriminant Analysis, LDA),也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,...

发表了文章 • 2015-10-31 15:28 • 0 条评论

0
推荐
1967
阅读

机器学习数据挖掘算法必读经典

必读经典1. Programming Collective Intelligence 作者 : Toby Segaran 出版社 : O'Reilly Media, Inc.评语 : 近年出的入门好书,培养兴趣是最重要的一环.2. Machine Learning 作者 : Tom M. Mitchell出版社 : McGraw-Hill Science/Engineering/Math评语 : 很多章节有点到...

发表了文章 • 2015-10-31 15:19 • 0 条评论