
统计学
如何找一条船舶从开工到完工时间的时间段中75%进度的数据?
各位前辈,小弟想参与BI的项目
加权欧式距离的权值应该怎么设定?
如何用爬虫爬取航空网站?航空公司的票务信息,能够实时抓取的那种?
数据预处理后,预测结果的取值是否还需要还原?
求问,有人知道随机森林里面子树变量个数选择上有什么讲究吗?
第一本 ECharts 数据可视化书籍出版了!
ID王大伟 发表了文章 • 2020-12-28 11:42
R语言将大型Excel文件转为dta格式
Economicoder 发表了文章 • 2020-12-26 14:33
centos以rpm安装cudnn
safa 发表了文章 • 2020-12-18 10:18
pytesseract安装,中文识别OCR
safa 发表了文章 • 2020-12-10 14:04
UltraEdit打开文件的编码显示
safa 发表了文章 • 2020-11-30 16:11
python在windows上使用multiprocessing Pool要运行在if __name__=="__main__"
safa 发表了文章 • 2020-11-27 19:25
centos 安装opencv
safa 发表了文章 • 2020-11-11 09:51
16737
16737
一般来说,分类的数据量肯定要大于30,统计意义上大于30,代表的是统计意义上的大样本量。
数据量大的样本,分类效果一般会小于数据量小的样本。但也不是越大越好,数据量越大... 显示全部 »
一般来说,分类的数据量肯定要大于30,统计意义上大于30,代表的是统计意义上的大样本量。
数据量大的样本,分类效果一般会小于数据量小的样本。但也不是越大越好,数据量越大就容易产生噪声数据
提供几点参考:
1.选择合适的抽样框,这个非常重要。关系到你的分类目标
2.在普通的验证性分类模型选择上,一般选择〉30,<10000的样本量来看模型的效果
3.如果数据量确实非常大,参考1,2抽取一部分数据来完成模型的选择,然后利用全量数据来验证模型。全量非常大的话,可以采用大数据的一些处理方式,比如spark
2、《Introduction to Statistical Learnign》简称ISL——Trevor Hastie/Robert Ti... 显示全部 »
2、《Introduction to Statistical Learnign》简称ISL——Trevor Hastie/Robert Tibshirani,是统计学习的入门级读物(英文的,这两位教授也是Standford的教授,Stanford上有相关的教学视频),同时此书也是经典著作《Elements of Statistical Learning》简称ESL的入门版;3、《统计学习方法》——李航,干货很多,有数学推导,难度适中,中文。
产生原因: 1 变量相关的共同趋势;2 滞后变量的引入; 3 样本资料的限制
消除多重共线性的方法:
1.增加样本容量
2.利用先验信息改变
3... 显示全部 »
产生原因: 1 变量相关的共同趋势;2 滞后变量的引入; 3 样本资料的限制
消除多重共线性的方法:
1.增加样本容量
2.利用先验信息改变
3.删除不必要的解释变量:参数的约束形式
4.其它方法:逐步回归法,岭回归(ridge regression),主成分分析(principal components ).
使用R语言
删除不必要的方法的时候,最好使用一下逐步回归法,这样比较科学一点。
主成分分析的方法使用比较简单科学,建议用该方法。
你这是与业务有关的,所以建议从感觉入手,你感觉哪方面可以作为切入点,就对这个切入点进行分析,其实也就是看看数据情况啥的,说实话,大学学的那点东西远远不够,你可以针对具体问题的实现方法来发帖... 显示全部 »
你这是与业务有关的,所以建议从感觉入手,你感觉哪方面可以作为切入点,就对这个切入点进行分析,其实也就是看看数据情况啥的,说实话,大学学的那点东西远远不够,你可以针对具体问题的实现方法来发帖求助~
关于BI,学院上有个视频介绍,免费的
更重要的是:学校学的知识只是书本知识,即使再贴近实际,所学知识只是一个理论铺垫或者架构。在实际业务中所用到的统计方法,是无法预知的,保持一颗学习的态度就好,当然了,前期的理论铺垫要理解,起码的理论机理要弄明白。
更重要的是:学校学的知识只是书本知识,即使再贴近实际,所学知识只是一个理论铺垫或者架构。在实际业务中所用到的统计方法,是无法预知的,保持一颗学习的态度就好,当然了,前期的理论铺垫要理解,起码的理论机理要弄明白。

结实 回答了问题 • 2016-09-29 09:53 • 1 个回复
传统统计学方法是由于计算或取样能力有限所产生的。随着大数据的发展,尤其是当今后计算机的计算能力足够时,传统的统计学方法是不是就失去了存在的意义
1、最终成绩是什么变量,是等级的还是连续型的?
2、各指标的数据类型?
3、做模型的时候是否需要归一化?
4、之前涉及到一个变量选择问题,可以参照一些方法;
5、可以用多元回归模型,如用step函数进行模型选择;
6、另外,如果是对最... 显示全部 »
1、最终成绩是什么变量,是等级的还是连续型的?
2、各指标的数据类型?
3、做模型的时候是否需要归一化?
4、之前涉及到一个变量选择问题,可以参照一些方法;
5、可以用多元回归模型,如用step函数进行模型选择;
6、另外,如果是对最终成绩进行预测,也可以使用回归树模型、神经网络模型、随机森林等等

浩彬老撕 回答了问题 • 2017-01-14 15:29 • 2 个回复
大家好 我想请教一下偏相关分析方面的问题 例如A与bcd有相关性 我应该怎么用偏相关来分析bcd中的哪个对A的影响更大一些呢?
https://ask.hellobi.com/blog/wetalkdata/5308
https://ask.hellobi.com/blog/wetalkdata/5308

陈老师 回答了问题 • 2017-02-20 21:57 • 1 个回复
我是一名本科生,学的是统计学,自学了一些机器学习的知识和R语言或python之类的软件,想问一下大家统计和数据挖掘关系大么,除了学习这些算法和软件我还要学啥。本人只参加过一些数学建模比赛,数据分析师干的事和数学建模是一样的么?
不过说实在的,你是学生还是在职啊?要是学生的话好好学基础课,尽早去实习一下比啥都管用。要是在职的话,即使做算法,会调包就好了,真的不需要去啃什么书,没啥用处的,... 显示全部 »
不过说实在的,你是学生还是在职啊?要是学生的话好好学基础课,尽早去实习一下比啥都管用。要是在职的话,即使做算法,会调包就好了,真的不需要去啃什么书,没啥用处的,微积分和线性代数更没啥用处。其实如果只是做表哥表姐的话统计学都没啥用处,哈哈
《人人都会数据分析》20万字电子版
面包君 发表了文章 • 2018-01-03 15:15
《R的极客理想》系列图书作者张丹:用R语言把数据玩出花样
R语言中文社区 发表了文章 • 2017-09-28 09:59
关联规则R语言实战(Apriori算法)
婷婷糖 发表了文章 • 2017-08-05 20:34
用R语言开始量化投资
张丹 发表了文章 • 2017-05-22 13:08
数据分析,R还是Python?真的是个问题么?
张土豆 发表了文章 • 2017-05-17 18:05
绪论:第一个机器学习样例
射命丸咲 发表了文章 • 2017-05-17 09:54
R语言图表美化——巧用分面表达优化图表布局,做出堪比杂志级视觉体验的商务图表
EasyCharts 发表了文章 • 2017-05-12 10:43
【重磅干货】65页PPT讲述一个完整R语言与数据挖掘的案例
datakong 发表了文章 • 2017-05-12 09:42
机器学习入门算法:从线性模型到神经网络
天善智能 发表了文章 • 2017-04-27 11:13
简单的文本可视化—词云
王亨 发表了文章 • 2017-04-06 13:56
数据可视化实践之美(开篇)
谢佳标 发表了文章 • 2017-04-06 10:17
今天来挖挖你的QQ聊天记录
王亨 发表了文章 • 2017-04-05 14:48
R语言构建追涨杀跌量化交易模型
张丹 发表了文章 • 2017-03-21 14:14
R语言构建配对交易量化模型
张丹 发表了文章 • 2017-03-21 14:09
R语言地图可视化之——移花接木
EasyCharts 发表了文章 • 2017-02-27 11:35
如何找一条船舶从开工到完工时间的时间段中75%进度的数据?
加权欧式距离的权值应该怎么设定?
求问,有人知道随机森林里面子树变量个数选择上有什么讲究吗?
多因素方差分析ols报错(已解决)
tableau 如何实现列标题转成一行?
R语言怎么画带坐标轴的函数图像啊,比如y=x²
R语言中,dataframe一般都有索引(即行号),该怎么去掉行号这一列数据?
请教统计大神,我们在做用户属性的时候,需要进行事后加权处理,目前有4个核心指标需要纳入权重系数中,但是交叉项太多了,有没有其他处理办法呢?
不同分布的抽样难度要如何衡量?
如何通过sql语句生成零售单上的服饰搭配情况
如何使用大数据技术对一个人的交友圈子质量进行分析?
【阿里云系列视频直播】老师,如果想学会使用算法和模型,来解决业务问题,对数学和统计学的掌握需要达到什么样的程度
数据分析 和 统计 在实际工作和学习的怎么区别 怎么去学习,求各位大佬指点
神经网络模型效果评估提升图的起始值小于1
【R语言量化投资】老师,我想问一下,经济统计专业的学生有r基础,想进去金融行业,需要哪些必备技能?
mean median mode,均值 中位数 众数
safa 发表了文章 • 2020-04-23 15:07
今夜,大数据带你了解当代青年加班狗
企业数据化管理 发表了文章 • 2019-10-17 17:15
成为数据分析师要掌握的统计知识(进阶版)
DataFrog 发表了文章 • 2019-08-28 18:39
成为数据分析师要掌握的统计学知识(基础版)
DataFrog 发表了文章 • 2019-08-28 18:37
大数据时代 传统统计学依然是数据分析的灵魂
企业数据化管理 发表了文章 • 2019-08-23 11:17
机器学习札记3——《统计学习方法》第一章(2)
皮大大 发表了文章 • 2019-08-10 13:07
生物/医学(生物统计学,基因统计学,生物信息学,制药学等)
社会学/环境学(社会统计学,心理学,人口学,空间统计学,环境统计学等)
工业工程学(质量控制,可靠性分析等)
经济学/金融学(精算学,金融统计学等)
工程学/计算机科学(统计学习,数据挖掘,信号/图像采样/处理等)
基础科学(统计物理学,统计化学等)