2
推荐
5834
阅读
入门时间序列ARIMA模型基本应用(附R代码)
最近看了时间序列,本文想简单通俗的介绍一下ARIMA算法的应用,每一步的意义,用R代码实现选择R中的时间序列数据skirts.dat。以此数据为例,举一个入门例子。1.首先把数据导入,并设置开始时间,查看走势图skirts <- scan("http://robjhyndman.com/tsdldata/roberts/skirts.dat",skip=5)
skirtsts<- ts(skirts,sta...
2
推荐
2649
阅读
R语言模块化Rattle——导入数据
随着现在数据分析越来越普及化,很多业务领域需要用到数据分析,所有挖掘工具,我最喜欢的是spss modeler,界面化非常方便,但毕竟不开源。开源工具也有很多,java有开源的weka,R语言也有工具Rattle。Rattle安装比较简单在现有的R控制台的基础上输入如下命令即可> install.packages("RGtk2")
> install.packages...
5
推荐
2744
阅读
代价敏感数据挖掘在智慧健康中的应用
代价敏感数据挖掘方法源于类不平衡数据。故障诊断、在医疗诊断、欺诈检测等实际领域中,不同的分类错误会产生不同的代价。而传统分类算法,如决策树、贝叶斯、神经网络、支持向量机、k-近邻等,致力于提高分类精度,而未考虑代价因素(即假设所有误分类具有相同代价),使得传统分类器的应用受到了限制。在机器学习领域...
7
推荐
3571
阅读
简单开源数据挖掘工具weka进行文本聚类
目前非代码的数据挖掘工具很多,但非开源,weka是一款开源软件。只要安装jdk环境就可使用(具体安装jdk可以百度)本文将论述如何不用代码,使用weka操作,通过与文档频数与单词权的特征选择方法进行文本聚类(数据为附件)第一步:将weka创建NetBeans文件目录中将weka导入NetBeans软件中, 1 在某处新建一个WEKA-Re...
4
推荐
1728
阅读
记录一下linux环境postgresql的安装
首先,防火墙已关闭/iptables: Firewall is not running.SELINUX=disabled进而,安装1. 下载PostgreSQL 源码包# wget http://ftp.postgresql.org/pub/source/v9.4.3/postgresql-9.4.3.tar.bz22. 解压源码包# tar xjf postgresql-9.4.3.tar.bz23. 进入解压后的目录# cd postgresql-9.4.34.安装依赖包yum -y install gcc*y...
1
推荐
2009
阅读
Python3简单连接postgresql
记录一下Python3简单连接postgresql的方法将附件中的setup.py运行,然后把附件中的postgresql文件夹放入Python的lib里面import postgresqlimport postgresql.driver as pg_driverdb = pg_driver.connect(user="postgres",password="hzyyzc",host="localhost",port=5432)ps = db.prepare("SELECT user_id FROM ht_tq_mode...
6
推荐
1614
阅读
Python3爬取目标经销商数据
目前爬虫也是很热门,本文采用Python3进行语法编写,Python3与Python2中的函数会有所不同,但是相差不大,具体的问题可以百度找到,因有朋友在做汽车方面的业务,因此需要一些网络数据进行支撑,一个个找会非常的繁琐,因此之前弄了些爬虫数据。这里进行其中一部分爬虫的代码共享。首先要定义一些常量# !/usr/bin/env py...
5
推荐
4907
阅读
R语言快速深度学习进行回归预测
深度学习在过去几年,由于卷积神经网络的特征提取能力让这个算法又火了一下,其实在很多年以前早就有所出现,但是由于深度学习的计算复杂度问题,一直没有被广泛应用。一般的,卷积层的计算形式为:其中、x分别表示当前卷积层中第j个特征、前一层的第i个特征;k表示当前层的第j个特征与前一层的第i个特征之间的卷积核;M...
4
推荐
2949
阅读
无人机对大数据的应用
本人曾经是机电专业,过去做了一段时间无人机图像视频模式识别的科研工作,后来从事过零售与电信行业的数据挖掘的工作。因此从本人对数据挖掘与人工智能的认知来看,大数据BI方向依然存在着进步空间,但进步空间没有非结构化数据未来进步的空间大。近期也跟现在以无人机为主题创业的小伙伴深度聊天,觉得图像视频数据的...
7
推荐
4801
阅读
R语言分析老九门到底谁是主角
本人最近看了老九门,两大男主角都是颜值担当,我的朋友中有喜欢佛爷(陈伟霆),有的喜欢二爷(张艺兴)。从我的朋友中发现更多人倾向于张艺兴扮演的二爷,他们认为二爷(张艺兴)是男1号。但是从出场次数和演员表排名佛爷(陈伟霆)都在二爷(张艺兴)之前。我一直认为佛爷(陈伟霆)是主演,也让我对这二位谁是主角产...
5
推荐
1921
阅读
Excel基础之求最优解
Excel篇之求最优解企业生产与销售过程中,通常在各种原材料限制下,为了实现最大利润的情况下,需要求出最优解。这时候会涉及到求优的方法。本文以一个简单例子论述如何excel求解最优结果首先数据如下:目标:总利润最大变量:A,B原材料的产量约束条件:原材料使用量小于可用量 进而进行规划求解,首先加载项进而进...
5
推荐
1959
阅读
Excel基础之回归模型建立
Excel篇之回归分析回归分析在日常的业务分析中使用广泛,主要目的在于找出目标变量的影响因子,例如:影响每个会员的在门店下次消费的金额的影响因素可能会有剩余积分,历史消费次数等等。如果通过回归分析建立相应模型,可对每个会员的在门店下次消费的金额进行有效预测,然而确定每个会员的销售价值。回归分析方法比较...
5
推荐
1830
阅读
4
推荐
1458
阅读
python3之协同过滤综述
协同过滤主要是计算人与人之间的距离,Python缔造的recommendations函数如下####数据集(用户,电影名字,评分)critics={'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5,
'Just My Luck': 3.0, 'Superman Returns': 3.5, 'You, Me and Dupree': 2.5,
'The Night Listener': 3.0},
'Gene Seym...
6
推荐
2249
阅读
R语言篇之热门手型号简单爬虫
本文以爬取热门手机型号为例##1.首先加载爬虫包library(RCurl)library(XML)library(reshape)##2.伪装表头,目的在于对方的服务器识别不到你真正的信息myheader=c( "User-Agent"="Mozilla/5.0(Windows;U;Windows NT 5.1;zh-CN;rv:1.9.1.6", "Accept"="text/htmal,application/xhtml+xml,application/xml;q=0...