python 爬虫提取豆瓣出版社名字问题
0
#以下是我的代码
import re
import urllib.request
data=urllib.request.urlopen("https://read.douban.com/provider/all").read()
data.decode('utf-8')
pat='<div class="name">(.*?)</div>'
result=re.compile(pat).findall(str(data))
print(result)
#输出结果是以下这样形式的
['\\xe5\\x8d\\x9a\\xe9\\x9b\\x86\\xe5\\xa4\\xa9\\xe5\\x8d\\xb7', '\\xe5\\x8c\\x97\\xe4\\xba\\xac\\xe9\\x82\\xae\\xe7\\x94\\xb5\\xe5\\xa4\\xa7\\xe5\\xad\\xa6\\xe5\\x87\\xba\\xe7\\x89\\x88\\xe7\\xa4\\xbe', '\\xe5\\x8c\\x97\\xe4\\xba\\xac\\xe5\\xb8\\x88\\xe8\\x8c\\x83\\
请问哪里出问题了吗
求大神解释
import re
import urllib.request
data=urllib.request.urlopen("https://read.douban.com/provider/all").read()
data.decode('utf-8')
pat='<div class="name">(.*?)</div>'
result=re.compile(pat).findall(str(data))
print(result)
#输出结果是以下这样形式的
['\\xe5\\x8d\\x9a\\xe9\\x9b\\x86\\xe5\\xa4\\xa9\\xe5\\x8d\\xb7', '\\xe5\\x8c\\x97\\xe4\\xba\\xac\\xe9\\x82\\xae\\xe7\\x94\\xb5\\xe5\\xa4\\xa7\\xe5\\xad\\xa6\\xe5\\x87\\xba\\xe7\\x89\\x88\\xe7\\xa4\\xbe', '\\xe5\\x8c\\x97\\xe4\\xba\\xac\\xe5\\xb8\\x88\\xe8\\x8c\\x83\\
请问哪里出问题了吗
求大神解释
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
0595099 2018-08-26 回答
赞同来自:
这样就行