如何用python做文本挖掘?就是有一个语料库,然后给一个新的文本,然后根据语料库进行归类?求思路?

0
已邀请:
1

Jason_Huang 2017-04-13 回答

例举一些Python处理库:
NLTK:Python的自然语言处理库;
NetworkX:Python的复杂网络分析库(e.g. 社交网络);
sklearn:Python的机器学习库;
Numpy:Python科学计算的底层库,主要支持数组和矩阵计算等;
Pandas:Python的数据分析库;
SciPy:Python的高级科学计算库,包括概率统计等;
statsmodels:Python的统计分析库;
SymPy:Python的符号计算库;
snownlp:情感分析;
textblob.
做短文本用线性svm,效果有目共睹,分词用jieba,词语向量化用Word2vec

要回复问题请先登录注册