Python 文本挖掘

0
#分析盗墓笔记的词频
data=open("C:/Users/My/Desktop/dmbj.txt",encoding="gbk18030",errors="ignore").read()
keywords=jieba.analyse.extract_tags(data,19)
print(keywords)

没有加encoding="gbk18030",errors="ignore"的时候是UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 2551382: illegal multibyte sequence;
然后加过之后LookupError: unknown encoding: gbk18030;
请问这个问题怎么解决?
已邀请:
0

ID王大伟 - 人生苦短,我选Python。 2018-04-29 回答

gbk18030这个编码估计是没有的      你换成utf-8编码试试
0

cdn007 - 喜欢自由空间! 2018-05-02 回答

为什么我输出的文本全部是数字呢?     附件里有下载好的文件。

要回复问题请先登录注册