简单的happy

学习记录,我的成长家园

4
推荐
11090
阅读

给定公司名称excel列表,在天眼查搜索爬取企业工商信息(改进1)

上一篇写了天眼查公司详情页单页面爬取公司基本信息(https://ask.hellobi.com/blog/jasmine3happy/6200),这里改进一步。需求提供公司名称,需要获取公司工商注册信息,欲查找的公司名称存储在excel里。步骤分解1.读取excel数据(1)打开工作簿import xlrd def open_excel(file): try: book = xlrd.open_w...

发表了文章 • 2017-02-18 17:33 • 2 条评论

6
推荐
15361
阅读

简单爬取天眼查数据(非严谨)

一、常规抓包分析比如要爬取http://www.tianyancha.com/company/2310290454该页面的基础信息。通过火狐浏览器抓包,可以发现,所要数据都在下图的json文件里查看其请求伪装成浏览器爬取该文件:import requests header = { 'Host': 'www.tianyancha.com', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; r...

发表了文章 • 2017-02-10 13:43 • 5 条评论

3
推荐
3133
阅读

kettle将一行数据处理为多行数据

需求现有数据如表A,username是用户名,products是购买的商品名,如第一行数据表示为用户name1购买了apple,milk,eggs这三样物品。物品之间的分隔符为多样,这里有;,、这三种形式。现要将该表进行处理,处理为表B形式,即一个用户名对应一件商品为一条处理过程1.新建一个转换2.表输入配置好数据库连接,并写上sql语句se...

发表了文章 • 2017-01-13 12:41 • 3 条评论

4
推荐
3995
阅读

【NumPy学习指南】笔记--第三章 常用函数

概述这一章学习了NumPy的常用函数,主要涵盖以下内容:数组相关的函数;从文件中载入数据;将数组写入文件;简单的数学和统计分析函数。 下表列举这一章用到的NumPy常用函数以及ndarray对象的函数:接下来过一遍本章的程序代码:首先导入需要用到的包import numpy as np import matplotlib.pyplot as plt % matplotlib ...

发表了文章 • 2017-01-12 13:42 • 2 条评论

12
推荐
1616
阅读

给2017年的自己定几个小目标

      从2014年毕业到现在,已经两年半了。在这两年半的时间里,自学了很多东西,linux,java,html,css,javascript,mysql,oracle,kettle,python。。。很杂,很乱,没有一个系统的学下来,也都是学过就忘,因为没有操作。      刚毕业那会,学了3个月的linux,java,html,css,jav...

发表了文章 • 2017-01-05 13:17 • 12 条评论

1
推荐
1844
阅读

浅谈数据分析和数据建模(转自PPV课 » 浅谈数据分析和数据建模)

有参考价值,防找不到,就转过来了。大数据应用有几个方面,一个是效率提升,帮助企业提升数据处理效率,降低数据存储成本。另外一个是对业务作出指导,例如精准营销,反欺诈,风险管理以及业务提升。过去企业都是通过线下渠道接触客户,客户数据不全,只能利用财务数据进行业务运营分析,缺少围绕客户的个人数据,数据...

发表了文章 • 2017-01-03 09:03 • 0 条评论

5
推荐
2912
阅读

《Python数据可视化编程实践》代码笔记--第四章学习更多图表和定制化

准备工作依然在Jupyter Notebook中执行代码,首先导入相关包,并配置好图片交互和中文显示环境。import pandas as pd import numpy as np import sys reload(sys) sys.setdefaultencoding('utf-8') import matplotlib as mpl import matplotlib.cm as cm import matplotlib.pyplot as plt %matplotlib inline plt.rcP...

发表了文章 • 2016-12-24 16:33 • 1 条评论

4
推荐
4299
阅读

《Python数据可视化编程实践》代码笔记--第三章绘制并定制化图表

准备工作这章详细介绍并展示了教多matplotlib的功能。打开Jupyter Notebook,导入需要的包,并配置好图片交互和中文显示环境:import pandas as pd import numpy as np import sys reload(sys) sys.setdefaultencoding('utf-8') import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.cm as cm %...

发表了文章 • 2016-12-20 17:17 • 5 条评论

5
推荐
3209
阅读

Python--matplotlib 绘图可视化练手--折线图/条形图

最近学习matplotlib绘图可视化,感觉知识点比较多,边学习边记录。对于数据可视化,个人建议Jupyter Notebook。1.首先导包,设置环境import pandas as pd import numpy as np import sys reload(sys) sys.setdefaultencoding('utf-8') import matplotlib.pyplot as plt %matplotlib inline #使图片内嵌交互环境显示 plt....

发表了文章 • 2016-12-08 11:19 • 2 条评论

0
推荐
1212
阅读

【第二章】Numpy基础----数组的分割

NumPy数组可以进行水平、垂直或深度分割。水平分割: hsplit(a, 3) split(a, 3, axis =1) 垂直分割: vsplit(a, 3) split(a, 3, axis =0) 深度分割: dsplit(a, 3)

发表了文章 • 2016-10-23 16:28 • 0 条评论

0
推荐
1426
阅读

【NumPy学习指南】Numpy基础----数组的组合

NumPy数组有水平组合、垂直组合和深度组合等多种组合方式。以下组合函数的参数为以adarray为对象的元祖水平组合: hstack((a, b)) concatenate((a, b), axis = 1) column_stack((a, b)) 垂直组合: vstack((a, b)) concatenate((a, b), axis = 0) row_stack((a, b)) 深度组合: dstack((a, b))

发表了文章 • 2016-10-23 14:53 • 0 条评论

0
推荐
1771
阅读

【NumPy学习指南】Numpy基础----改变数组的维度

改变数组的维度,可以使用ravel,flatten,reshape和resize函数来进行修改。revel():展平,不改变原数据,返回视图 flatten():展平,不改变原数据,请求分配内存 reshape:设置维度 shape:设置维度,直接改变原数组 resize:改变维度,直接改变原数组 transpose():转置,不改变原数组

发表了文章 • 2016-10-22 22:57 • 0 条评论

0
推荐
1585
阅读

【Python数据分析与挖掘实战】20161019作业——逆向输出乘法口诀表

课堂上老师演示了用python输出打印乘法口诀表,但课堂演示的乘法表没有对齐,我在课后对其进行了处理,详见代码中方法chengfakoujue()作业:逆向输出乘法口诀,代码见方法ni_chengfakoujue()# -*- coding:utf-8 -*- ''' 课堂案例:输出乘法口诀表 ''' def chengfakoujue(): for i in range(1, 10): for j...

发表了文章 • 2016-10-22 18:11 • 0 条评论