1
推荐
1101
阅读

<Python数据分析与挖掘实战-课程作业7>爬取天善智能课程信息

第6次作业是安装scrapy,这个百度一下就可以了。作业要求:通过通用爬虫的方式,爬取天善智能,并将课程名,链接,学员数信息提取出来,存储到文件中。0.新建爬虫项目和爬虫文件打开cmd(我用的powershell ise,老师推荐的powercmd在我电脑上使用有点问题)C:\py爬虫> scrapy startproject hellobi C:\py爬虫\hellobi...

发表了文章 • 2016-12-10 11:04 • 0 条评论

0
推荐
1655
阅读

<Python数据分析与挖掘实战-课程作业5>爬取千图网某个频道的高清图片

作业要求:爬取千图网(http://www.58pic.com)某个频道的高清图片作业难点:正确找到图片链接并用正则表达式写出代码如下: """ Created on Mon Nov 28 13:59:15 2016 @author: FengYiz """ import urllib.request import re import urllib.error urllib.request.urlcleanup() keyname="pm" #设置关键词平面,可以...

发表了文章 • 2016-11-29 21:53 • 0 条评论

1
推荐
1228
阅读

<Python数据分析与挖掘实战-课程作业4>爬取csdn博客首页显示的所有文章,并保存到本地

作业描述:爬取http://blog.csdn.net/首页中的所有文章,每个文章单独生成一个本地网页后存到本地中。作业难点在伪装浏览器。代码如下:""" Created on Sat Nov 26 14:17:13 2016 @author: FengYiz """ import urllib.request import re import urllib.error url="http://blog.csdn.net/" headers=("User-Agent","Moz...

发表了文章 • 2016-11-26 15:48 • 0 条评论

0
推荐
969
阅读

<Python数据分析与挖掘实战-课程作业3>提取出版社名称,并写入文件中

作业描述:从https://read.douban.com/provider/all中爬出所有出版社名称,并写入Excel文档中。代码如下:""" Created on Fri Nov 25 15:03:51 2016 @author: FengYiz """ #提取出版社名称 import re import urllib.request pat='<div class="name">(.*?)</div>' data=urllib.request.urlopen("https://r...

发表了文章 • 2016-11-25 16:06 • 0 条评论

1
推荐
1584
阅读

<Python数据分析与挖掘实战-课程作业2>合并多个Excel文件

事先准备好三个Excel的文档。命名为file1,file2,file3每个文档都有两个sheet,两个sheet的内容不同。现在要创建一个新的文档,将三个file的所有内容都合并到新文档的sheet1中。代码如下:""" Created on Sun Nov 20 16:15:27 2016 @author: FengYiz """ from openpyxl import load_workbook from openpyxl import Wo...

发表了文章 • 2016-11-24 19:00 • 0 条评论

1
推荐
1046
阅读

<Python数据分析与挖掘实战-课程作业1>倒序乘法口诀表

代码如下:""" Created on Wed Nov 16 23:43:08 2016 @author: FengYiz """ for i in range(9,0,-1): #从9到1,-1表示降序 for j in range(1,i+1): print(str(i)+"*"+str(j)+"="+str(i*j)+" ",end="") print()忙着毕业找工作,忙着毕业论文,忙着国考。赶进度的我,辛酸记录~输出结果:

发表了文章 • 2016-11-16 23:55 • 1 条评论