Python 文本挖掘
0
#分析盗墓笔记的词频
data=open("C:/Users/My/Desktop/dmbj.txt",encoding="gbk18030",errors="ignore").read()
keywords=jieba.analyse.extract_tags(data,19)
print(keywords)
没有加encoding="gbk18030",errors="ignore"的时候是UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 2551382: illegal multibyte sequence;
然后加过之后LookupError: unknown encoding: gbk18030;
请问这个问题怎么解决?
data=open("C:/Users/My/Desktop/dmbj.txt",encoding="gbk18030",errors="ignore").read()
keywords=jieba.analyse.extract_tags(data,19)
print(keywords)
没有加encoding="gbk18030",errors="ignore"的时候是UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 2551382: illegal multibyte sequence;
然后加过之后LookupError: unknown encoding: gbk18030;
请问这个问题怎么解决?
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
2 个回复
ID王大伟 - 人生苦短,我选Python。 2018-04-29 回答
赞同来自:
cdn007 - 喜欢自由空间! 2018-05-02 回答
赞同来自: