统计学

投票

已解决

2820

浏览

如何找一条船舶从开工到完工时间的时间段中75%进度的数据？

贡献

汪照坤(KhunOne) 回复了问题 • 2021-09-15 16:56

投票

回答

3482

浏览

R语言读取csv文件，含有中文文本字段，且制表符/t分隔，无列名，读出的数据条数少了绝大部分，求解？data<-read.csv("fmmdata.csv",sep="\t",header = F,fileEncoding = "utf-8")

数据挖掘 R语言

郑州韩先生发起了问题 • 2018-05-01 10:14

投票

回答

2679

浏览

各位前辈，小弟想参与BI的项目

BIEE 机器学习数据分析数据挖掘数据仓库人工智能大数据 ETL 商业智能

yaogunjita 发起了问题 • 2017-02-17 10:30

投票

回答

2431

浏览

加权欧式距离的权值应该怎么设定？

机器学习统计学 Python 数据挖掘

钟家福17 发起了问题 • 2017-11-18 17:35

投票

已解决

7027

浏览

如何用爬虫爬取航空网站？航空公司的票务信息，能够实时抓取的那种？

贡献

R语言数据挖掘

laical 回复了问题 • 2021-07-15 11:07

投票

回答

2718

浏览

数据预处理后，预测结果的取值是否还需要还原？

贡献

聚类算法文本挖掘机器学习数据挖掘

博观回复了问题 • 2021-07-14 11:37

投票

回答

6904

浏览

求问，有人知道随机森林里面子树变量个数选择上有什么讲究吗？

统计学大数据

rahjjhgff 发起了问题 • 2018-04-04 16:59

推荐

2366

浏览

第一本 ECharts 数据可视化书籍出版了！

我的第一本书终于出版了，书名叫做《ECharts数据可视化：入门、实战与进阶》，目前在当当、京东已经上架，可购买学习！什么是EChartsECharts，为Enterprise Charts的缩写，是一种商业级数据图表。作为百度的一个...

ID王大伟发表了文章 • 2020-12-28 11:42

推荐

1524

浏览

R语言将大型Excel文件转为dta格式

作者：Economicoder微信公众号：数据学徒本文以2000年度我国工业企业数据库为例，该文件后缀名为xlsx，包含约16万条记录，文件有88M这么大。直接使用Excel打开都费劲：等待时间久，电脑风扇呼呼呼作响。如果尝试...

Economicoder 发表了文章 • 2020-12-26 14:33

推荐

2644

浏览

centos以rpm安装cudnn

https://developer.nvidia.com/rdp/cudnn-archivethanks to:494150793@qq.com &j534s073J登录下载CentOS and Red Hat Linux# installing sudo rpm -ivh libcudnn7-7.6.5.32-1.cuda10.0.x86_64.rpm sudo # Upd...

safa 发表了文章 • 2020-12-18 10:18

推荐

1972

浏览

pytesseract安装，中文识别OCR

网上搜一堆解决问题的文章都没用1. 安装 pytesseractpip install pytesseract跑python识别程序，下列语句会报错pytesseract.image_to_string(Image.open(filename))报错：Error opening data file /usr/local/sha...

safa 发表了文章 • 2020-12-10 14:04

推荐

1287

浏览

UltraEdit打开文件的编码显示

一般Unicode指UTF-16打开UTF-8，用UFT-16编辑，保存还是UTF-8状态：ASCII 编码文件显示 DOS或UNIXUTF-8 编码文件显示为 U8-DOS或U8-UNIXUTF-16编码文件显示为 U-DOS 或U-UNIX原文...

safa 发表了文章 • 2020-11-30 16:11

推荐

2293

浏览

python在windows上使用multiprocessing Pool要运行在if name=="main"

解释见 https://blog.csdn.net/qq_26442553/article/details/94595715原文如下：1.执行一个python的multiprocessing.Pool进程池程序，实现多进程程序，代码如下，结果在windows下执行报错，但是在linux和uni...

safa 发表了文章 • 2020-11-27 19:25

推荐

941

浏览

震惊！一行python代码找个人工智能女朋友！

print('\u60f3\u5f97\u7f8e')

safa 发表了文章 • 2020-11-27 16:23

推荐

1004

浏览

centos 安装opencv

pip install opencv-python --default-timeout 1000 -i https://pypi.mirrors.ustc.edu.cn/simple/

safa 发表了文章 • 2020-11-11 09:51

liliwu 回答了问题 • 2016-04-26 22:56 • 3 个回复不感兴趣

简单线性回归公式问题

16738

16737

浩彬老撕回答了问题 • 2016-05-22 22:10 • 1 个回复不感兴趣

只有均值和标准差以及样本容量的多组数据该怎么进行统计学分析？

即使仅有方差和均值，你还是可以做t检验的方差分析的，查看公式就知道了，公式最后也是样本均值，方差和样本容量。通过比较，你可以得到各个组别之间的均值是否有显著差异。但唯一的问题可能在于你的样本量比较少。

牟瑞回答了问题 • 2016-05-26 08:24 • 1 个回复不感兴趣

各位社区大神，用支持向量机做分类一般的需要多少数据量

支持向量机做分类的数据量跟你的分类目标和对象有关。做分类本身不是数据量这一个指标所衡量的。
一般来说，分类的数据量肯定要大于30，统计意义上大于30，代表的是统计意义上的大样本量。
数据量大的样本，分类效果一般会小于数据量小的样本。但也不是越大越好，数据量越大... 显示全部 »

BAO胖子回答了问题 • 2016-06-20 16:09 • 3 个回复不感兴趣

如何发现用电量异常单位？

用电量和季节相关性极大，你想想商业用电，夏天开空调，和秋天啥也不开，耗电量能一样吗？即使是居民用电，夏天频繁洗澡，天天开空调，和其他季节也有很大不同。而耗电量巨大的比如冶金，制糖这种企业，按照季节的产销也有一定规律，南方用电北方用电价格差异很大，水电便宜的要死... 显示全部 »

MarsJ 回答了问题 • 2016-07-11 10:22 • 5 个回复不感兴趣

想学习统计学，哪本书好，包含回归，聚类，神经网络，决策树

1、《统计学》第五版，William Mendenhall/Terry Sincich，统计学入门的经典教材，中文版；
2、《Introduction to Statistical Learnign》简称ISL——Trevor Hastie/Robert Ti... 显示全部 »

高阔回答了问题 • 2016-07-16 11:37 • 1 个回复不感兴趣

回归分析中出现的多重共线性问题是什么，如何处理？

多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确.

产生原因： 1 变量相关的共同趋势；2 滞后变量的引入； 3 样本资料的限制

消除多重共线性的方法：
1.增加样本容量
2.利用先验信息改变
3... 显示全部 »

okajun 回答了问题 • 2016-07-20 16:56 • 1 个回复不感兴趣

统计学本科生初学BI，求各位大神指点一二

我也是统计学专业的，刚毕业啥都不会，恩，现在毕业4年了，还是啥都不会~
你这是与业务有关的，所以建议从感觉入手，你感觉哪方面可以作为切入点，就对这个切入点进行分析，其实也就是看看数据情况啥的，说实话，大学学的那点东西远远不够，你可以针对具体问题的实现方法来发帖... 显示全部 »

结实回答了问题 • 2016-08-15 15:52 • 2 个回复不感兴趣

本人统计学研究生，未来希望往数据分析方向发展，请问大神们在实际工作中需要哪些具体的统计方法

检验类，回归类，以及方法所适应的环境；
更重要的是：学校学的知识只是书本知识，即使再贴近实际，所学知识只是一个理论铺垫或者架构。在实际业务中所用到的统计方法，是无法预知的，保持一颗学习的态度就好，当然了，前期的理论铺垫要理解，起码的理论机理要弄明白。

结实回答了问题 • 2016-09-29 09:53 • 1 个回复不感兴趣

传统统计学方法是由于计算或取样能力有限所产生的。随着大数据的发展，尤其是当今后计算机的计算能力足够时，传统的统计学方法是不是就失去了存在的意义

这里是统计抽样部分的知识可能会被大数据取代，但其他统计知识还是难以撼动的，比如各种检验，各种预测分析

liliwu 回答了问题 • 2016-11-04 16:43 • 2 个回复不感兴趣

关于中位数

要排序的哥

marxsong 回答了问题 • 2016-12-21 11:18 • 1 个回复不感兴趣

关于数据成绩的问题，遇以下问题

有几个问题需要明确一下：
1、最终成绩是什么变量，是等级的还是连续型的？
2、各指标的数据类型？
3、做模型的时候是否需要归一化？
4、之前涉及到一个变量选择问题，可以参照一些方法；
5、可以用多元回归模型，如用step函数进行模型选择；
6、另外，如果是对最... 显示全部 »

浩彬老撕回答了问题 • 2017-01-14 15:29 • 2 个回复不感兴趣

大家好我想请教一下偏相关分析方面的问题例如A与bcd有相关性我应该怎么用偏相关来分析bcd中的哪个对A的影响更大一些呢?

之前的文章详细讨论了各种相关系数和对应在SPSS上的操作，可以参考：
https://ask.hellobi.com/blog/wetalkdata/5308

陈老师回答了问题 • 2017-02-20 21:57 • 1 个回复不感兴趣

我是一名本科生，学的是统计学，自学了一些机器学习的知识和R语言或python之类的软件，想问一下大家统计和数据挖掘关系大么，除了学习这些算法和软件我还要学啥。本人只参加过一些数学建模比赛，数据分析师干的事和数学建模是一样的么？

客观来说，你还欠一个实习，实习完了啥都知道了，快去投简历吧

陈老师回答了问题 • 2017-04-06 14:45 • 2 个回复不感兴趣

做数据分析，要对各种分析方法的数学原理了解到何种程度才算及格？

看个人发展方向，如果是做分析的话统计学懂一些就好了，如果真想做算法的话才去研究比较深的东西

不过说实在的，你是学生还是在职啊？要是学生的话好好学基础课，尽早去实习一下比啥都管用。要是在职的话，即使做算法，会调包就好了，真的不需要去啃什么书，没啥用处的，... 显示全部 »

悟回答了问题 • 2017-09-14 18:25 • 2 个回复不感兴趣

如何找一条船舶从开工到完工时间的时间段中75%进度的数据？

这个不复杂吧，就是处理下结束时间而已结束时间等于开始时间 + 分钟（结束时间-开始时间）*0.75

投票

已解决

2820

浏览

如何找一条船舶从开工到完工时间的时间段中75%进度的数据？

Oracle SQL SERVER 统计学 SQL 数据分析

汪照坤(KhunOne) 回复了问题 • 2021-09-15 16:56

投票

回答

2431

浏览

加权欧式距离的权值应该怎么设定？

机器学习统计学 Python 数据挖掘

钟家福17 发起了问题 • 2017-11-18 17:35

投票

回答

6904

浏览

求问，有人知道随机森林里面子树变量个数选择上有什么讲究吗？

统计学大数据

rahjjhgff 发起了问题 • 2018-04-04 16:59

投票

回答

2691

浏览

多因素方差分析ols报错（已解决）

数据挖掘统计学 Python

as0810114 发起了问题 • 2019-01-16 11:46

投票

回答

2173

浏览

tableau 如何实现列标题转成一行？

统计学数据分析 Power BI 微软BI 商业智能

小廖回复了问题 • 2018-10-25 18:00

投票

回答

2139

浏览

R语言怎么画带坐标轴的函数图像啊，比如y=x²

R语言统计学新手入门

鱼悲文发起了问题 • 2018-04-18 15:49

投票

回答

6710

浏览

R语言中，dataframe一般都有索引（即行号），该怎么去掉行号这一列数据？

大数据数据挖掘统计学商业智能 R语言

杜雨回复了问题 • 2018-01-31 23:46

投票

回答

1487

浏览

请教统计大神，我们在做用户属性的时候，需要进行事后加权处理，目前有4个核心指标需要纳入权重系数中，但是交叉项太多了，有没有其他处理办法呢？

统计学

Sander 发起了问题 • 2017-11-29 08:57

投票

回答

1310

浏览

不同分布的抽样难度要如何衡量？

统计学数据分析

monaso 发起了问题 • 2017-11-22 09:13

投票

回答

1240

浏览

如何通过sql语句生成零售单上的服饰搭配情况

统计学

zww 发起了问题 • 2017-09-11 14:56

投票

回答

1594

浏览

如何使用大数据技术对一个人的交友圈子质量进行分析？

统计学大数据数据挖掘

Infor 回复了问题 • 2017-07-19 17:07

投票

回答

1548

浏览

【阿里云系列视频直播】老师，如果想学会使用算法和模型，来解决业务问题，对数学和统计学的掌握需要达到什么样的程度

机器学习统计学模型设计算法阿里云

天善小编发起了问题 • 2017-06-29 15:52

投票

回答

1460

浏览

数据分析和统计在实际工作和学习的怎么区别怎么去学习，求各位大佬指点

统计学数据分析

饼干君回复了问题 • 2017-06-08 14:18

投票

回答

1701

浏览

神经网络模型效果评估提升图的起始值小于1

商业智能统计学新手入门数据挖掘 SPSS

炜GE 发起了问题 • 2017-05-26 14:25

投票

回答

1548

浏览

【R语言量化投资】老师，我想问一下，经济统计专业的学生有r基础，想进去金融行业，需要哪些必备技能？

量化投资金融行业统计学 R语言

张丹回复了问题 • 2017-05-25 10:38

推荐

1216

浏览

mean median mode，均值中位数众数

有n个数，数值可以有重复，如: 1, 2, 2, 3, 3, 8, 9mean | 均值 | 唯一| n个数值的平均 | 1,2,2,3,3,8,9的均值是(1+2+2+3+3+8+9)/7=4 median | 中位数 | 唯一| 无论数值是否重复，都从小到大...

safa 发表了文章 • 2020-04-23 15:07

推荐

1414

浏览

今夜，大数据带你了解当代青年加班狗

“我累得像只狗，十八天没有卸妆，月抛带了两年半，作息紊乱，我却越来越胖，起来征战北五环。”上海彩虹室内合唱团一首《感觉身体被掏空》成为多少加班狗的内心BGM。中国加班有多疯狂？今年3月，国家统计局数据显...

企业数据化管理发表了文章 • 2019-10-17 17:15

推荐

1330

浏览

成为数据分析师要掌握的统计知识（进阶版）

阅读指南：总体均值和比例的统计推断总体方差的统计推断总体均值和比例的统计推断其实数据分析更多情况是两个总体的比较，譬如男女用户的差异、用户群体的差异、以及产品AB测试的好与坏，所以接下来对两个总体比...

DataFrog 发表了文章 • 2019-08-28 18:39

推荐

1204

浏览

成为数据分析师要掌握的统计学知识（基础版）

阅读路线：概率介绍离散型概率分布和连续型概率分布抽样和抽样分布区间估计假设检验概率介绍概率是指的对于某一个特定事件的可能性的数值度量，且在0-1之间。我们抛一枚硬币，它有正面朝上和反面朝上两种结果，通...

DataFrog 发表了文章 • 2019-08-28 18:37

推荐

2102

浏览

大数据时代传统统计学依然是数据分析的灵魂

引言：在数据“爆炸”的时代，大数据常常被寄予厚望。到底，什么样的数据才算大数据，怎样才能用好大数据，传统统计学还有用武之地吗？来源|中文互联网数据研究咨询中心清华大学统计学研究中心前不久成立，著名统计...

企业数据化管理发表了文章 • 2019-08-23 11:17

推荐

1190

浏览

机器学习札记3——《统计学习方法》第一章（2）

模型评估和选择训练误差和测试误差假设学习模型是，训练误差是模型关于训练数据集的平均损失：其中N是训练样本的容量训练误差是关于数据集的平均损失：其中当损失函数是0-1损失时，测试误差就变成了常见的测试数...

皮大大发表了文章 • 2019-08-10 13:07

推荐

4581

浏览

浅谈正态分布检验

正态分布是我们经常听到的一个名词，又叫高斯分布，许多模型或算法都要求数据服从正态分布，比如：pearson相关系数、线性回归等。样子如下：plot(density(rnorm(1000000))) # R语言代码关于正态分布的详细介绍可...

okajun 发表了文章 • 2019-01-12 20:44

推荐

浏览

ecsqfj 发表了文章 •

推荐

浏览

sny8md 发表了文章 •

推荐

浏览

ckmtbv 发表了文章 •

推荐

浏览

pbjq5s 发表了文章 •

推荐

浏览

z7i0vn 发表了文章 •

推荐

浏览

zeh9vi 发表了文章 •

推荐

浏览

uudvxe 发表了文章 •

推荐

浏览

ecsqfj 发表了文章 •

更多...

统计学(Statistics)是研究收集、分析、解读、展示及组织(collection, analysis, interpretation, presentation and organization)数据的学科，通过量化地研究随机性，从而理解数据的产生机制，并进行判别、预测、优化、决策。统计学理论和方法是很多现代科学分支的支柱，其广泛的应用深刻地影响现代生活，具有代表性的应用领域包括：

生物/医学(生物统计学，基因统计学，生物信息学，制药学等)
社会学/环境学(社会统计学，心理学，人口学，空间统计学，环境统计学等)
工业工程学(质量控制，可靠性分析等)
经济学/金融学(精算学，金融统计学等)
工程学/计算机科学(统计学习，数据挖掘，信号/图像采样/处理等)
基础科学(统计物理学，统计化学等)

话题描述

统计学(Statistics)是研究收集、分析、解读、展示及组织(collection, analysis, interpretation, presentation and organization)数据的学科，通过量化地研究随机性，从而理解数据的产... 查看全部

最佳回复者

: liliwu
获得 0 次赞同, 1 次感谢

: 浩彬老撕
获得 3 次赞同, 1 次感谢

: 咸鱼饼子
获得 1 次赞同, 1 次感谢

: 牟瑞
获得 1 次赞同, 0 次感谢

: 夏尔康
获得 1 次赞同, 1 次感谢

统计学

话题描述

相关话题

最佳回复者

1222 人关注该话题