小尚 - 天善智能：专注于商业智能BI和数据分析、大数据领域的垂直社区平台

2

推荐

1136

阅读

R英语每周记

导言：小编英文不好，每次看到R帮助密密麻麻的英文，每次翻词典感觉不是办法，特记下单词来，每周或者每日回看不日幸熟也~正文：meant---意味的perhaps--可能也许expect--期望proportion--比例count--数量formula--公式lables--标签limits--控制，限制parameters--参数statements--声明smoothing--光滑component--组成d...

发表了文章 • 2016-08-25 23:45 • 0 条评论

2

推荐

1301

阅读

apply函数家族用法

序言：在R中，有时候我们需要对列表中的各个元素进行逐一某种操作，这时候可以引用apply函数家族. 其名称及用法分别如下：apply()函数，用于数组或矩阵，通常以行或者列的方式进行遍历，对每个向量进行应用函数操作，并以向量返回结果lapply()函数，用于列表，通常对每个列表元素应用函数操作...

发表了文章 • 2016-08-25 07:22 • 2 条评论

4

推荐

1904

阅读

R语言之数据探索（一）

1.数据质量分析的必要性数据质量分析师数据预处理的前提，是数据挖掘分析结论有效性和准确性的基础，其主要任务是检查原始数据中是否存在脏数据。脏数据一般是指不符合要求，以及不能直接进行相应分析的数据，在常见的数据挖掘工作中，脏数据包括：缺失值异常值不一致的值重复数据及含有特殊符号（如# ￥ *等）的...

发表了文章 • 2016-08-23 17:18 • 0 条评论

1

推荐

1463

阅读

跟小S学统计：抽样及抽样方法

抽样目的总体数据量大或无法得到整个总体，为了取得总体的一般真实情况，需要进行抽取收集有关数据进行推断并回答总体的问题基础名词总体：所有感兴趣个体的集合抽样总体：从中抽取样本的总体抽样分：有限总体和无限总体简单随机样本：从容量为N的有限总体中抽取一个容量为n的样本，如果容量为n的每一个可能的样本都以相...

发表了文章 • 2016-08-16 00:21 • 0 条评论

2

推荐

1277

阅读

【数据化管理】之论竞争对手

意义：客户是谁投放渠道是什么营运策略如何优化自己的营销策略，评估营销效果定义和你抢夺各种资源的那些人或组织，抢夺的人千千万万，其中对资源掠夺性最强的人或者组织就是你的核心竞争对手资源的涵盖范围非常广，包括生产资源人力资源顾客资源资金资源人脉资源等。如何界定竞争对手人的角度 1）挖角...

发表了文章 • 2016-08-12 11:06 • 2 条评论

2

推荐

1179

阅读

论回归分析的认识

这几天查看大量的文章，对回归分析以及假设检验有了更深的认识这篇我打算从生活中的角度来分析，这样才算真正理解了先从基础知识开始回归分析，可以理解成你在生活中每次做一件事，总是受到隐形的各种元素的综合作用而形成的，但是有时候你能感觉出有个因素作用很大，但多大呢没法说出来，除了此，还有别的因素也发生作...

发表了文章 • 2016-08-09 01:32 • 1 条评论

2

推荐

1093

阅读

8月份文章规划目标

统计学基础知识抽样以及抽样的方法抽样分布及其各种分布的相关内容区间估计以及置信z分布t分布假设检验的相关基础R实战apply函数家族系列实战主成分分析处理缺失值（已写）ggplot2图形 shiny2包图形聚类算法分类-决策树/随机森林/支持向量机电商数据与excel分析常用的模型流量指标电商excel常用函数功能应用单控件-...

发表了文章 • 2016-08-07 19:10 • 1 条评论

2

推荐

1921

阅读

R总结-处理缺失值的方法

处理步骤：识别缺失数据检查导致数据缺失的原因（分类：mcar（完全随机缺失），随机缺失（mar），非随机缺失（nmar），后边最常见）删除包含缺失值的实例或用合理的数值代替缺失值识别缺失值 NA：代表缺失值NAN:代表不可能值函数is.na() is.nan()和is.infinite()可用来识别缺失值不可能值和...

发表了文章 • 2016-08-07 10:04 • 0 条评论

2

推荐

3056

阅读

小S学统计：连续型概率分布之指数分布

（智商的指数分布）基础回顾随机变量是对试验结果的数值描述，根据取值的不同分为离散型或连续型，对于如何确定随机变量是离散型还是连续型的方法，是把随机变量的值看做一条线段上的点。任意选择随机变量的两个值，假如线段上这两点之间的所有点都可能是随机变量的取值，则该随机变量就是连续型的。对于任何离散型随机...

发表了文章 • 2016-08-05 07:20 • 4 条评论

1

推荐

2005

阅读

R总结之图形边界

A 图形元素R图表由点线文本和多边形（填充区）组成。下面的图形参数控制了图形元素的绘制：pch=“+”用来绘点的字符。这个默认值随不同的图形驱动是不同的，不过通常都是“ ±”。除非使用“.”作为绘图字符，否则绘制的点都会比适当的位置高一点或者低一点，而不是恰好在指定位置。lty=2线条类型。并不是所有图形设备都支持...

发表了文章 • 2016-08-05 06:13 • 0 条评论

3

推荐

1439

阅读

R语言总结：数据导入与创建系列

数据的导入与导进数据读取read.csv("路径")#适合读取csv，不赋值的画直接展开数据，最好赋值read.table("路径"）#适合读取txt文件参数skip=10,跳过前10行nrows=10,读取前10行header=T,读取表头sep=""，分割符，默认为，row.names=NULL,不要序列号做第一列stringASFactor=F,字符不要自动转为因子encoding="utf-8",改变编...

发表了文章 • 2016-07-28 07:16 • 0 条评论

2

推荐

1247

阅读

市场营销类-读书笔记

中国企业界普遍停留在产品经营的思维层面，即使一流的中国企业。原因归家于“水煮青蛙”外边的市场环境顾客心理逐渐变迁之后，企业不能够感知到这种变化，往往还在沿用甚至套最有以往成功的经验和模式。本质原因是：假设出现问题了。试看：彼得圣吉：改善心智模式，不断探寻与质疑我们在既往经验中对环境所作出的假设。...

发表了文章 • 2016-07-27 12:00 • 0 条评论

1

推荐

1234

阅读

R基本操作总结（1）

1：基本概念的本质理解向量是一维数据，矩阵是二维数组，每个元素是相同的模式，数组与矩阵类似，但维度大于2.而数据框的列可以是不同的模式2：基本的操作查看数据-可以调用数组名/数据集$列名查看某一部分的数据-数组名+方括号+元素下标查看长度-length查看数据类型-str增加行-可以按行向量（rbind）或者列向量组合cbin...

发表了文章 • 2016-07-25 11:35 • 0 条评论

2

推荐

1334

阅读

R实战-第六章

以下是本人敲的全部代码并注释:install.packages("vcd")#安装library(vcd)#加载counts<-table(Arthritis$Improved)#对improve计数countsbarplot(counts,main="simple bar plot",xlab="improvement",ylab="frequency")#主要标题barplot(counts,main="horizontal bar plot",xlab="frequency",ylab="improvement",...

发表了文章 • 2016-07-22 17:22 • 1 条评论

1

推荐

1793

阅读

跟小S学统计:连续型概率分布之正态分布

内容回顾正态概率分布在实际中有的广泛的应用，比如，人的身高和体重考试成绩降雨量以及其它类似问题，都近似服从正态概率分布.正态概率分布是描述连续型随机变量最重要的概率分布，广泛应用于统计推断，在这些应用中，正态分布是对抽样可能得到结果的描述。正态概率密度函数u代表均值；代表标准差；e=2.71828由上图得...

发表了文章 • 2016-07-12 02:46 • 4 条评论