夏尔康

新人一枚的数据分析师,写写博客,交流学习

0
推荐
36
阅读

BP神经网络常用激活函数

本文主要是回答激活函数的使用我们认识的激活函数中sigmoid、ReLU等,今天就是要讲解一下这些函数的一些性质激活函数通常有一些性质:非线性:当激活函数是线性的时候,一个两层的神经网络就可以基本逼近所有的函数,但是,如果激活函数是恒等激活函数的时候,就不满足这个性质了,而且如果MLP使用的是恒等激活函数,那...

发表了文章 • 3 天前 • 2 条评论

0
推荐
116
阅读

Python实现oracle到MYSQL表数据批量插入

原本是想实现SQL SERVER到MYSQL的异库插入,发现SQL SERVER的的连接老出现问题,所以很是郁闷,刚刚本机有oracle自带和MYSQL,索性就使用这两个做一个实验;代码大部分参考天善最好学的人----王大伟的连接:https://ask.hellobi.com/blog/wangdawei/9367这部分代码我只是稍微做一下修改;在oracle库里我生成一个临时emp_...

发表了文章 • 2017-08-27 11:59 • 0 条评论

0
推荐
58
阅读

解决个人在conn /as sysdba中出现的insufficient privileges问题

个人环境,因为本人今天想要使用Python测试mysql数据插入oracle数据中,所以mysql的环境是准备好,可惜的是自己的oracle的scott的用户密码忘记了,很少烦恼,所以就想找回系统用户更改一下密码,但是在使用sqlplus中sqlplus /nologconn /as sysdba老出现insufficient privileges这个问题,后面翻了一下网络上的解答,大...

发表了文章 • 2017-08-26 10:07 • 0 条评论

3
推荐
153
阅读

手把手通过scala连接数据库

最近因为学习scala语言,最近工作上遇到一个问题,需要不借助ETL工具实现异库数据的插入,所以这时候通过scala语言操作数据库就是我遇到的第一个问题,具体思路是是通过JDBC去连接数据库,由于是手把手,文章肯定是面向像我这样不用JAVA语言的小白们首先你要准备的是驱动包com.MySQL.jdbc.Driver,如果没有就去官网下载...

发表了文章 • 2017-08-22 21:16 • 0 条评论

0
推荐
84
阅读

斯坦福大学机器学习笔记——高斯判别分析(转)

同朴素贝叶斯一样,高斯判别分析(Gaussian discriminant analysismodel, GDA)也是一种生成学习算法,在该模型中,我们假设y给定的情况下,x服从混合正态分布。通过训练确定参数,新样本通过已建立的模型计算出隶属不同类的概率,选取概率最大为样本所属的类。一、混合正态分布(multivariate normal distribution)混...

发表了文章 • 2017-08-03 09:30 • 0 条评论

0
推荐
99
阅读

【斯坦福---机器学习】复习笔记之牛顿方法(转)

前言:因为最近在看斯坦福的机器学习的公开课,所以转一些笔记本讲大纲:1.牛顿方法(Newton’s method) 2.指数族(Exponential family) 3.广义线性模型(Generalized linear models)1.牛顿方法假设有函数:,我们希望找到满足的值. 这里是实数. 牛顿方法执行下面的更新:  下图为执行牛顿方法的过...

发表了文章 • 2017-08-01 08:55 • 0 条评论

1
推荐
1142
阅读

使用python的gensim做主题模型分析(LDA模型)

由于本人水平有限,对LDA的模型介绍可能不够深入或者有误之处还请各位指出,在下谢谢了;在传统的主题挖掘中,我们可以最早的发现是使用文本聚类的算法,聚类的结果可能近似的认为满足一个主题,但是,这种基于聚类是算法普遍依赖文本之间的距离计算;而这种距离的量化在海量的文本中是难以定义的,在聚类的结果上也只是...

发表了文章 • 2017-06-05 22:28 • 4 条评论

1
推荐
413
阅读

简单的使用PYTHON对中文文本聚类并预测

前言这篇文章会接着上篇分词文章讲,内容也是比较简单,并没有做太多的深究,主要是为了让自己尽快熟悉PYTHON的语言环境,至于算法之类的讲解这里就不多说了工具:pycharm环境:python2.7在这里我导入习惯常用的包# -*- coding: UTF-8 -*-import sysimport osfrom sklearn.datasets.base import Bunchfrom sklearn import...

发表了文章 • 2017-06-01 21:18 • 0 条评论

7
推荐
778
阅读

用Python实现本文分词以及本地保存

我们通常在做中文文本分析的时候,首先都需要先对文本进行分词,分割成我们想要的形式,这里的话我就使用python进行文本分词,并保存在本地相应文件夹中,这里的话我使用的数据集是answer;好像复旦大学某个人收集的,抱歉,我没记住名字,至少说明我还是有点责任感,哈哈;入正题因为使用的python进行分词的话,我们就...

发表了文章 • 2017-05-25 21:46 • 3 条评论

1
推荐
258
阅读

初识pandas包的数据预处理

前言 这篇文章是通过一个简单的数据认识pandas在数据预处理上的一个运用,这个也是写给自己以后当作参考手册用的,部分步骤缺少Python代码,后面会加上,本文可能较为简单,不适合大神;本文的数据是书名《机器学习系统设计》第一章的数据,数据处理上不参考书里环境背景:python环境:2.7工具:Pycharm1、读入数据导入我...

发表了文章 • 2017-05-23 20:50 • 3 条评论

5
推荐
430
阅读

数据分析中常见的七种回归分析以及R语言实现(七)---弹性网络回归

其实这个方法比较新颖,自己本人也没怎么用过,看了不少文献,但是大多数都是枯燥公式推导;这里就写少量的简单公式求解,因为不写稍微长点话都不好意思发表了,因为这系列的文章只是写个介绍,毕竟如果只是写介绍的话实在太短了,接个我想要用的表情弹性网络回归说起来的话,其实它和lasso方法和岭回归方法有些关系,因...

发表了文章 • 2017-02-05 21:53 • 1 条评论

7
推荐
469
阅读

数据分析中常见的七种回归分析以及R语言实现(五)---套索回归

l套索回归,这个回归模型有些新颖,要写个详细的介绍估计要写好长,受限于水平,就写个普及文,所以这里就稍微简答的介绍一下;为什么我们老说多重共线性呢?那是,因为我们在研究数据的时候总会不可避免的出现多维度的数据,这时候高纬度的数据就会出现多重共线性,变量选择等;所以如何消除多重共线性确定最佳模型,是...

发表了文章 • 2017-01-17 21:37 • 3 条评论

10
推荐
515
阅读

数据分析中常见的七种回归分析以及R语言实现(四)---多项式回归

这篇文章是个普及文,比较浅,没有太深入;在我们平时做回归的时候,大部分都是假定自变量和因变量是线性,但有时候自变量和因变量可能是非线性的,这时候我们就可能需要多项式回归了,多项式回归就是自变量和因变量是非线性所做的一个回归模型,其表达式:Y=A0+A1X1+A2X2^2+ANXN^2+u 公式存手打,不是很好看,其特定就...

发表了文章 • 2017-01-10 22:15 • 2 条评论

9
推荐
590
阅读

数据分析中常见的七种回归分析以及R语言实现(三)---岭回归(代码部分全程引用谢佳标老师)

我们在回归分析的时候,古典模型中有一个基本的假定就是自变量之间是不相关的,但是如果我们在拟合出来的回归模型出现了自变量之间高度相关的话,可能对结果又产生影响,我们称这个问题为多重共线性,多重共线性又分为两种,一种是完全多重共线性,还有一种是不完全多重共线性;产生的原因有几个方面1、变量之间存在内部...

发表了文章 • 2017-01-08 22:43 • 3 条评论

22
推荐
334
阅读

再见2016,你好2017

不知不觉又到了写一年的总结的时候了,也是从2016年开始在天善坚持写博客学习的一年,对我来说是一个极其有意义的一年。首先回首一下我的2016年过程1、3月,在天善完成了自己的第一篇博客2、5月,回了趟西安看望了母校并和舍友们相聚3、7月,在咨询了小郭姐等人毅然的决定要跳槽了4,8月,入职新公司,这次接触更多的数...

发表了文章 • 2017-01-07 19:36 • 8 条评论