7
推荐
2796
阅读

使用scikit-learn进行电影评论情感分类

使用scikit-learn进行电影评论情感分类数据准备从网站Movie Review Data下载语料。这里选择polarity dataset v2.0。该数据集包含正负情感极性(pos和neg)的电影评论各1000条。下面,进行数据载入,并进行训练集/测试集划分。# load library import os import sys # set working directory os.chdir("D:\\my_python_wo...

发表了文章 • 2017-04-19 11:56 • 0 条评论

0
推荐
1386
阅读

Python中的线性代数运算

Python中的线性代数运算这里,为了熟悉Python语言的特性,我们采用一种最原始的方式去定义线性代数运算的相关函数。如果是真实应用场景,则直接使用NumPy的函数即可。1.向量创建一个向量我们可以把Python中的向量理解为有限维空间中的点。 height_weight_age = [70,170,40] grades = [95,80,75,62] 向量运算#### 加法定...

发表了文章 • 2017-04-13 09:49 • 0 条评论

4
推荐
2155
阅读

使用Python进行线性回归

线性回归是最简单同时也是最常用的一个统计模型。线性回归具有结果易于理解,计算量小等优点。如果一个简单的线性回归就能取得非常不错的预测效果,那么就没有必要采用复杂精深的模型了。今天,我们一起来学习使用Python实现线性回归的几种方法:通过公式编写矩阵运算程序;通过使用机器学习库sklearn;通过使用statmodel...

发表了文章 • 2017-04-13 09:44 • 0 条评论

2
推荐
2129
阅读

梯度下降算法的Python实现

1.梯度下降算法的理解我们在求解最优化问题的时候,需要最小化或最大化某一个目标函数。如线性回归中,就需要最小化残差平方和。某一向量的平方和函数可定义如下:def sum_of_squares(v): """computes the sum of squared elements in v""" return sum(v_i ** 2 for v_i in v) 梯度定义若f(x,y,z)在点P0(x0,y0,z...

发表了文章 • 2017-04-13 09:39 • 0 条评论

2
推荐
2185
阅读

使用scikit-learn实现多类别及多标签分类算法

使用scikit-learn实现多类别及多标签分类算法多标签分类格式对于多标签分类问题而言,一个样本可能同时属于多个类别。如一个新闻属于多个话题。这种情况下,因变量yy需要使用一个矩阵表达出来。而多类别分类指的是y的可能取值大于2,但是y所属类别是唯一的。它与多标签分类问题是有严格区别的。所有的scikit-learn分类器...

发表了文章 • 2017-04-13 09:34 • 0 条评论

4
推荐
2024
阅读

R爬虫之京东商城手机信息批量获取

在人手一部智能手机的移动互联网时代,智能手机对很多人来说,它就像我们身上生长出来的一个器官那样重要。如果你不能对各大品牌的『卖点』和『受众』侃上一阵,很可能会被怀疑不是地球人。今天我们来探索一下,如何从『京东商城』爬取各大品牌的手机信息。1.预备知识R爬虫需要掌握的技能包括:基本的网页知识,如html,...

发表了文章 • 2017-04-12 15:34 • 0 条评论

0
推荐
1665
阅读

Python网络爬虫之『美味的汤』

Python网络爬虫之『美味的汤』1.载入库函数from bs4 import BeautifulSoup from collections import Counter from time import sleep import requests import re 2.测试# 豆瓣top250首页 url = "https://movie.douban.com/top250" # 解析网页 soup = BeautifulSoup(requests.get(url).text,"lxml") # 提取链接 ## 先看看...

发表了文章 • 2017-04-12 15:20 • 0 条评论

0
推荐
1941
阅读

R爬虫之上市公司公告批量下载

selenium的安装及使用介绍Selenium是一个用于测试网页应用的开源软件。它提供了浏览器中的点击,滚动,滑动,及文字输入等驱动程序。这样,利用Selenium即可以通过脚本程序来替代人工进行测试一个开发软件的各种功能。在处理爬虫任务中,经常遇到需要输入文字,进行下拉菜单选择,以及鼠标点击等情景。这个时候,seleniu...

发表了文章 • 2017-04-12 15:18 • 0 条评论

5
推荐
3236
阅读

决策树算法的Python实现

一.决策树的基本思想决策树是一种基本的分类与回归方法,它可以看作if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。将决策树转换成if-then规则的过程如下:由决策树的根节点到叶节点的每一条路径构建一条规则; 路径内部结点的特征对应规则的条件; 叶节点的类对应规则的结论.决策树的路径具...

发表了文章 • 2016-05-09 19:56 • 1 条评论

2
推荐
2543
阅读

使用scikit-learn进行文本分类

scikit-learn简介scikit-learn是Python最为流行的一个机器学习库。它具有如下吸引人的特点:简单、高效且异常丰富的数据挖掘/数据分析算法实现;基于NumPy,SciPy,以及matplotlib,从数据探索性分析,数据可视化到算法实现,整个过程一体化实现;开源,有非常丰富的学习文档。尤其是当我们要进行多种算法的效果对比评价,...

发表了文章 • 2016-05-09 19:52 • 0 条评论