读后感

读后感

2
推荐
3098
浏览

Allen Downey的<贝叶斯思维:统计建模的Python学习法>和更多Think系列书

10.24的博客我介绍了一本<贝叶斯思维:统计建模的Python学习法>,英文名是<Think Bayes: Bayesian Statistics in Python>,作者是Allen Downey.当时我看的是一本中文版纸质的,这类书一般我都要实践一...

seng 发表了文章 • 2016-11-06 15:47

2
推荐
2573
浏览

介绍一本书--《贝叶斯思维:统计建模的Python学习法》

最近在看《贝叶斯思维:统计建模的Python学习法》这本书,书买了很久了,一直没下决心看。贝叶斯方法还是要好好学习的,Monty Hall的问题(3个门开了一个后是否要换选择的门)我一直不太明白。代码示例Python写的...

seng 发表了文章 • 2016-10-24 23:16

6
推荐
1739
浏览

在天善连续获得积分90天,发个帖庆祝下

今天终于把没有积分的天数都消灭掉了,发个帖庆祝下。^-^

seng 发表了文章 • 2016-07-08 17:50

4
推荐
2400
浏览

《Python网络数据采集》读后总结索引页

列了一个《Python网络数据采集》读后总结的介绍索引页,供大家使用。前言:在序言里提到的爬虫应用的通用步骤1.从URL获取对应的HTML代码(Retrieving HTML data from a domain name)2.解析HTML代码获取想要的信息(...

seng 发表了文章 • 2016-06-10 14:51

3
推荐
2779
浏览

《Python网络数据采集》读后总结 --第13、14章单元测试和远程抓取

第13章单元测试介绍了基本的测试概念,如何使用Python unittest?Python自带标准的测试模块unittest, 可以使用assert测试。示例: 1-wikiUnitTest.py  2-wikiSeleniumTest.py  3-interactiveTest...

seng 发表了文章 • 2016-05-15 10:24

3
推荐
2592
浏览

《Python网络数据采集》读后总结 --第12章避免爬虫的抓取陷阱

这章<如何避免爬虫的抓取陷阱>,我觉得最重要的就是这句Looking Like a Human,一般的网站是不会屏蔽人的正常操作的,如何让网站把你的操作当做正常的操作就是要点。主要说了4点方法:Adjust Your HeadersH...

seng 发表了文章 • 2016-05-13 13:30

5
推荐
2637
浏览

《Python网络数据采集》读后总结 --第11章图像处理和文字识别

《Python网络数据采集》第11章介绍了图像处理和如何实现图像中文本的基本方发,实现图像中文本只要用于CAPTCHAs就是验证码,还有OCR.图像处理相关的库:Pillow 和 Tesseract 1.通常先使用Pillow进行图像处理,如做...

seng 发表了文章 • 2016-05-12 12:00

2
推荐
2734
浏览

《Python网络数据采集》读后总结 --第10章抓取JavaScript生成的页面

《Python网络数据采集》第10章介绍了如何抓取JavaScript生成的页面的基本原理,同时也介绍了一下Xpath的语法,Xpath的一些语法,对于定位还是很有用的。第10章内容简介:1.先介绍了一下网页主要用的javascript库...

seng 发表了文章 • 2016-05-11 13:36

4
推荐
2485
浏览

《Python网络数据采集》读后总结 --第9章提交表单和login后获取数据

这章主要讲如何提交表单和session相关的内容,例如:在天善上要看到个人信息是这个页面http://www.flybi.net/inbox/,如果没登陆的话就跳转到http://www.flybi.net/account/login,需要login后才能访问。这就涉及...

seng 发表了文章 • 2016-05-08 10:50

1
推荐
3078
浏览

《Python网络数据采集》读后总结 --第8章自然语言读写

注意这章开始说指定了范围,是是针对英语的,用于中文不是不可以,但有些是不适用的。这章主要介绍2块内容,都是浅浅的提了一下:1.马尔可夫模型(Markov Model)  是一种统计模型,广泛应用在语音识别,词...

seng 发表了文章 • 2016-05-02 20:28

6
推荐
5309
浏览

合并多个PDF文档的解决:附生成天善用户的博客内容合集的Python示例

上一篇《天善博客内容如何转成PDF文档》介绍了如何从html生成pdf的原理,不过wkhtmltopdf有限制,文档多了,需要生成多个pdf文件,原来使用http://www.pdfmerge.com/在线服务合并文档。感觉不完美,合并更多文件...

seng 发表了文章 • 2016-04-29 10:02

6
推荐
5309
浏览

合并多个PDF文档的解决:附生成天善用户的博客内容合集的Python示例

上一篇《天善博客内容如何转成PDF文档》介绍了如何从html生成pdf的原理,不过wkhtmltopdf有限制,文档多了,需要生成多个pdf文件,原来使用http://www.pdfmerge.com/在线服务合并文档。感觉不完美,合并更多文件...

seng 发表了文章 • 2016-04-29 10:02

2
推荐
3098
浏览

Allen Downey的<贝叶斯思维:统计建模的Python学习法>和更多Think系列书

10.24的博客我介绍了一本<贝叶斯思维:统计建模的Python学习法>,英文名是<Think Bayes: Bayesian Statistics in Python>,作者是Allen Downey.当时我看的是一本中文版纸质的,这类书一般我都要实践一...

seng 发表了文章 • 2016-11-06 15:47

2
推荐
2573
浏览

介绍一本书--《贝叶斯思维:统计建模的Python学习法》

最近在看《贝叶斯思维:统计建模的Python学习法》这本书,书买了很久了,一直没下决心看。贝叶斯方法还是要好好学习的,Monty Hall的问题(3个门开了一个后是否要换选择的门)我一直不太明白。代码示例Python写的...

seng 发表了文章 • 2016-10-24 23:16

6
推荐
1739
浏览

在天善连续获得积分90天,发个帖庆祝下

今天终于把没有积分的天数都消灭掉了,发个帖庆祝下。^-^

seng 发表了文章 • 2016-07-08 17:50

4
推荐
2400
浏览

《Python网络数据采集》读后总结索引页

列了一个《Python网络数据采集》读后总结的介绍索引页,供大家使用。前言:在序言里提到的爬虫应用的通用步骤1.从URL获取对应的HTML代码(Retrieving HTML data from a domain name)2.解析HTML代码获取想要的信息(...

seng 发表了文章 • 2016-06-10 14:51

3
推荐
2779
浏览

《Python网络数据采集》读后总结 --第13、14章单元测试和远程抓取

第13章单元测试介绍了基本的测试概念,如何使用Python unittest?Python自带标准的测试模块unittest, 可以使用assert测试。示例: 1-wikiUnitTest.py  2-wikiSeleniumTest.py  3-interactiveTest...

seng 发表了文章 • 2016-05-15 10:24

3
推荐
2592
浏览

《Python网络数据采集》读后总结 --第12章避免爬虫的抓取陷阱

这章<如何避免爬虫的抓取陷阱>,我觉得最重要的就是这句Looking Like a Human,一般的网站是不会屏蔽人的正常操作的,如何让网站把你的操作当做正常的操作就是要点。主要说了4点方法:Adjust Your HeadersH...

seng 发表了文章 • 2016-05-13 13:30

5
推荐
2637
浏览

《Python网络数据采集》读后总结 --第11章图像处理和文字识别

《Python网络数据采集》第11章介绍了图像处理和如何实现图像中文本的基本方发,实现图像中文本只要用于CAPTCHAs就是验证码,还有OCR.图像处理相关的库:Pillow 和 Tesseract 1.通常先使用Pillow进行图像处理,如做...

seng 发表了文章 • 2016-05-12 12:00

2
推荐
2734
浏览

《Python网络数据采集》读后总结 --第10章抓取JavaScript生成的页面

《Python网络数据采集》第10章介绍了如何抓取JavaScript生成的页面的基本原理,同时也介绍了一下Xpath的语法,Xpath的一些语法,对于定位还是很有用的。第10章内容简介:1.先介绍了一下网页主要用的javascript库...

seng 发表了文章 • 2016-05-11 13:36

4
推荐
2485
浏览

《Python网络数据采集》读后总结 --第9章提交表单和login后获取数据

这章主要讲如何提交表单和session相关的内容,例如:在天善上要看到个人信息是这个页面http://www.flybi.net/inbox/,如果没登陆的话就跳转到http://www.flybi.net/account/login,需要login后才能访问。这就涉及...

seng 发表了文章 • 2016-05-08 10:50

1
推荐
3078
浏览

《Python网络数据采集》读后总结 --第8章自然语言读写

注意这章开始说指定了范围,是是针对英语的,用于中文不是不可以,但有些是不适用的。这章主要介绍2块内容,都是浅浅的提了一下:1.马尔可夫模型(Markov Model)  是一种统计模型,广泛应用在语音识别,词...

seng 发表了文章 • 2016-05-02 20:28

6
推荐
5309
浏览

合并多个PDF文档的解决:附生成天善用户的博客内容合集的Python示例

上一篇《天善博客内容如何转成PDF文档》介绍了如何从html生成pdf的原理,不过wkhtmltopdf有限制,文档多了,需要生成多个pdf文件,原来使用http://www.pdfmerge.com/在线服务合并文档。感觉不完美,合并更多文件...

seng 发表了文章 • 2016-04-29 10:02