【原】python中文文本挖掘资料集合

浏览: 1746

这些网址是我在学习python中文文本挖掘时觉得比较好的网站,记录一下,后期也会不定期添加:

1.http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98

非常全的网址,讲了各个库,还有github代码地址

2.http://blog.csdn.net/abcjennifer/article/details/23615947

Rachel Zhang的文章,运用的各种算法,可以测出准确率

3.http://www.ibm.com/developerworks/cn/data/library/bd-natural-language/

利用python、scikit和文本分析来实现行为分析

4.http://developer.51cto.com/art/201507/485276.htm

一个完整的介绍分词,从导入数据集到最后结果

5.http://www.tuicool.com/articles/U3uiiu

一个简单的例子,jieba分词

6.http://scikit-learn.org/stable/modules/feature_extraction.html

官网上对文本分析的介绍

7.http://ju.outofmemory.cn/entry/74958

scikit文本特征提取

8.http://blog.csdn.net/lsldd/article/details/41520953

一个博主写的,简单的分词

9.http://zhuanlan.zhihu.com/textmining-experience/19630762

知乎上的文本分析专栏

10.http://www.clips.ua.ac.be/pages/pattern-en#sentiment

pattern包得用法

作者:Charlotte77 

出处:http://www.cnblogs.com/charlotte77/ 

本文以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,非商业用途! 

推荐 0
本文由 胡晓曼 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册