课程作业文章分类 FengYiz的blog - 天善智能：专注于商业智能BI和数据分析、大数据领域的垂直社区平台

1

推荐

1101

阅读

<Python数据分析与挖掘实战-课程作业7>爬取天善智能课程信息

第6次作业是安装scrapy，这个百度一下就可以了。作业要求：通过通用爬虫的方式，爬取天善智能，并将课程名，链接，学员数信息提取出来，存储到文件中。0.新建爬虫项目和爬虫文件打开cmd（我用的powershell ise，老师推荐的powercmd在我电脑上使用有点问题）C:\py爬虫> scrapy startproject hellobi C:\py爬虫\hellobi...

发表了文章 • 2016-12-10 11:04 • 0 条评论

0

推荐

1655

阅读

<Python数据分析与挖掘实战-课程作业5>爬取千图网某个频道的高清图片

作业要求：爬取千图网（http://www.58pic.com）某个频道的高清图片作业难点：正确找到图片链接并用正则表达式写出代码如下： """ Created on Mon Nov 28 13:59:15 2016 @author: FengYiz """ import urllib.request import re import urllib.error urllib.request.urlcleanup() keyname="pm" #设置关键词平面，可以...

发表了文章 • 2016-11-29 21:53 • 0 条评论

1

推荐

1228

阅读

<Python数据分析与挖掘实战-课程作业4>爬取csdn博客首页显示的所有文章，并保存到本地

作业描述：爬取http://blog.csdn.net/首页中的所有文章，每个文章单独生成一个本地网页后存到本地中。作业难点在伪装浏览器。代码如下：""" Created on Sat Nov 26 14:17:13 2016 @author: FengYiz """ import urllib.request import re import urllib.error url="http://blog.csdn.net/" headers=("User-Agent","Moz...

发表了文章 • 2016-11-26 15:48 • 0 条评论

0

推荐

969

阅读

<Python数据分析与挖掘实战-课程作业3>提取出版社名称，并写入文件中

作业描述：从https://read.douban.com/provider/all中爬出所有出版社名称，并写入Excel文档中。代码如下：""" Created on Fri Nov 25 15:03:51 2016 @author: FengYiz """ #提取出版社名称 import re import urllib.request pat='<div class="name">(.*?)</div>' data=urllib.request.urlopen("https://r...

发表了文章 • 2016-11-25 16:06 • 0 条评论

1

推荐

1584

阅读

<Python数据分析与挖掘实战-课程作业2>合并多个Excel文件

事先准备好三个Excel的文档。命名为file1，file2，file3每个文档都有两个sheet，两个sheet的内容不同。现在要创建一个新的文档，将三个file的所有内容都合并到新文档的sheet1中。代码如下：""" Created on Sun Nov 20 16:15:27 2016 @author: FengYiz """ from openpyxl import load_workbook from openpyxl import Wo...

发表了文章 • 2016-11-24 19:00 • 0 条评论

1

推荐

1046

阅读

<Python数据分析与挖掘实战-课程作业1>倒序乘法口诀表

代码如下：""" Created on Wed Nov 16 23:43:08 2016 @author: FengYiz """ for i in range(9,0,-1): #从9到1，-1表示降序 for j in range(1,i+1): print(str(i)+"*"+str(j)+"="+str(i*j)+" ",end="") print()忙着毕业找工作，忙着毕业论文，忙着国考。赶进度的我，辛酸记录~输出结果：

发表了文章 • 2016-11-16 23:55 • 1 条评论