lmm1225

大数据爱好者

0
推荐
1989
阅读

PS IMAGO PRO—PACK可视化功能

1.PS IMAGO PRO—树形图功能Ø作为交叉表分析的图形补充Ø基于频率或汇总变量值的集群范围Ø可以同时概述集群大小和每个集群中的模式类别Ø清晰直观地评估每一类Ø快速概述每个集群中的KPI示例如下:若想一目了然的看到每个区域,每种类型的产品销售额,使用树图可以直观展示可视化结果如下:透过此图,可以直观清楚地看出每个...

发表了文章 • 2019-03-31 10:17 • 0 条评论

0
推荐
1447
阅读

稀有事件预测

商业希望运用数据的预测能力以提升获益预测必然是针对稀有事件来执行稀有事件容易被算法视做杂音而被消除稀有事件与其余事件不等价,有时一个较不准的模型反而能造成更多获益函数调整法: SQRT, LN, LOG, Sigmoid天花板法:设定数值閾值,超越此閾者以閾值填补。通常还会搭配其他函数调整分位法:将数值转换为相对的分位数

发表了文章 • 2019-03-08 14:52 • 0 条评论

0
推荐
1172
阅读

如何解决过拟合?

确认是否排除常识确认G/B定义是否有双重概念取样空间涵盖性是否充足能否取得更多数据变量共线性变量系数异常排除异常logical trend确保logical trend跨时间趋势一致Step-wise移除变量找出过拟合凶手

发表了文章 • 2019-03-08 14:43 • 0 条评论

0
推荐
1759
阅读

商业智能、数据挖掘精品电子书下载汇总【60本】

ETL相关精品资料下载汇总 http://www.cognoschina.net/club/thread-72855-1-1.html R语言精品电子书下载汇总 http://www.cognoschina.net/club/thread-72851-1-1.html 商业智能系列电子书籍 【16本】 面向商业智能的数据挖掘算法和多智能体系统的体系结构以及优化 http://www.cognoschina.net/club/thread-72963-1-1...

发表了文章 • 2019-01-03 13:51 • 0 条评论

0
推荐
1498
阅读

数据挖掘数据集查询

一.由简单和通用的数据集开始1.data.gov( https://www.data.gov/ )这是美国政府公开数据的所在地,该站点包含了超过19万的数据点。这些数据集不同于气候、教育、能源、金融和更多领域的数据。2.data.gov.in( https://data.gov.in/ )这是印度政府公开数据的所在地,通过各种行业、气候、医疗保健等来寻找数据,你可以在这...

发表了文章 • 2018-12-08 13:38 • 0 条评论

0
推荐
1989
阅读

决策树C5.0在药物选择中的应用

假设您是一位收集研究数据的医学研究人员。您已收集了关于身患同一疾病的一组患者的数据。在治疗过程中,每位患者均对五种药物中的一种有明显反应。您的其中一项职责是通过数据挖掘找出适用于今后患有此疾病的患者的药物。数据字段如下:数据字段            描述年龄     ...

发表了文章 • 2018-11-29 21:26 • 0 条评论

0
推荐
2283
阅读

数据审核节点的重要性——准备分析数据

数据审核节点将首先全面检查用户导入到 IBM SPSS Modeler 的数据。在初始数据探究过程中经常会使用数据审核报告,该报告显示了摘要统计以及每个数据字段的直方图和分布图,并且它使您可以指定缺失值、离群值和极值的处理。本例使用 telco.sav 数据文件1.读入数据2. 添加"类型"节点以定义字段,并将 churn 指定为目标字段...

发表了文章 • 2018-11-29 15:54 • 0 条评论

0
推荐
1445
阅读

数据挖掘前奏——自动数据准备 (ADP)

    准备数据以进行分析是任何数据挖掘项目中最重要的步骤之一,可以说也是最耗时的步骤之一。自动数据准备 (ADP) 节点为您处理任务、分析数据并识别修订、筛选出有问题或者可能不可用的字段、在适当的时候派生新属性以及通过智能筛分技术提高性能。您可以完全自动化地使用节点,允许节点选择并应用修正,或者...

发表了文章 • 2018-11-29 15:26 • 0 条评论

0
推荐
1313
阅读

连续目标的自动建模——自动数值建模

通过"自动数值"节点,您可以为连续(数值范围)结果自动创建和比较不同的模型,例如预测某项财产的应征税值。借助于单独节点,可以估计和比较一组候选模型,并生成一个模型子集以进一步分析。这类节点与自动分类器(预测目标变量为分类变量)节点工作方式相同。该节点将候选模型中的最佳模型合并到单个汇总(整体)模型...

发表了文章 • 2018-11-29 14:49 • 0 条评论

0
推荐
1902
阅读

对客户响应建模分析(分类型目标的自动建模)

通过CLEMENTINE的"自动分类器"节点,您可以为分类(例如某个指定客户是否可能拖欠贷款或者是否对特定的报价做出响应)或名义(集合)目标自动创建和比较多个不同的模型。在本例中,我们将搜索标志(是或否)结果。在一个相对简单的流中,节点生成一组候选模型并对它们进行排序,选择最有效的模型,然后将它们合并为一个...

发表了文章 • 2018-11-29 14:20 • 0 条评论

0
推荐
1198
阅读

数据挖掘解决方案

数据分析提供支持决策过程的知识,并促进各个业务领域的活动。由于特殊性和个体挑战,每个领域不仅需要技术,还需要模型,场景,业务知识或运营和管理系统形式的定制解决方案。因此,基于IBM SPSS产品系列的Predictive Solutions为选定区域创建了自己的综合应用程序和系统。其中包括:欺诈检测,客户关系管理,案例管理...

发表了文章 • 2018-11-26 12:52 • 0 条评论

2
推荐
2220
阅读

基于主成分分析的顾客偏好分析

选取卢文岱老师《SPSS for windows 统计分析》一书中的案例data12-02,对书中提及的  主成分分析给出一般操作流程,介绍主成分分析在市场研究中的应用。数据说明: 1980年某汽车制造商在竞争对手中选择17中车型,访问了25位顾客,要求他们根据自己的偏好对17种车型打分。打分范围0-9.9,9.9表示最高程度的偏好...

发表了文章 • 2018-11-25 17:34 • 0 条评论

0
推荐
3031
阅读

转:如何用因子分析结果进行聚类分析

得到因子得分并不是最终的结果,降维是为了使我们的思路更加集中,但降维结束后得到的却未必是我们所期望的。为了更好的加以分析,我们可以在降维因子分析的基础上对得到的潜在因子进行聚类或者计算出综合因子得分进行排序。【数据】:美国洛杉矶 12 个地区的调查数据(人口、校龄、总雇员、房价、服务),该数据来自卢...

发表了文章 • 2018-11-25 17:29 • 0 条评论

0
推荐
2854
阅读

K-means聚类——在移动公司客户细分中的应用

    聚类分析在各行各业应用十分常见,而顾客细分是其最常见的分析需求,顾客细分总是和聚类分析挂在一起。顾客细分,关键问题是找出顾客的特征,一般可从顾客自然特征和消费行为入手,在大型统计分析工具出现之前,主要是通过两种方式进行“分群别类”,第一种,用单一变量进行划段分组,比如,以消费频率变量...

发表了文章 • 2018-11-25 16:35 • 0 条评论

0
推荐
1929
阅读

聚类分析——你必须知道的事

聚类分析包括R型聚类(对变量指标聚类)和Q型聚类(对个案观测聚类)数据:有 20 种 12 盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS for Windows 统计分析》data11-03。一.如何对变量进行聚类(即选择哪些主要的变量)——R型聚类1、如何筛选聚类变量?现在我们有 4 个变...

发表了文章 • 2018-11-25 11:07 • 0 条评论