大神请指教 淘宝图片爬虫获取不到什么东西
0
下面是我的代码,运行后,爬取不到任何东西,请大神帮忙看看~感谢~~~~~
import urllib.request
import re
keyname="毛针织衫"
key=urllib.request.quote(keyname)
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
urllib.request.install_opener(opener)
for i in range(0,10):
url="https://s.taobao.com/search%3F ... 2Bstr(i*60)
data=urllib.request.urlopen(url).read().decode("utf-8","ignore")
pat='pic_url":"//(.*?)"'
imagelist=re.compile(pat).findall(data)
for j in range(0,len(imagelist)):
thisimg=imagelist[j]
thisimgurl="http://"+thisimg
file="D:/pictures/"+str(i)+str(j)+".jpg"
urllib.request.urlretrieve(thisimgurl,filename=file)
import urllib.request
import re
keyname="毛针织衫"
key=urllib.request.quote(keyname)
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
urllib.request.install_opener(opener)
for i in range(0,10):
url="https://s.taobao.com/search%3F ... 2Bstr(i*60)
data=urllib.request.urlopen(url).read().decode("utf-8","ignore")
pat='pic_url":"//(.*?)"'
imagelist=re.compile(pat).findall(data)
for j in range(0,len(imagelist)):
thisimg=imagelist[j]
thisimgurl="http://"+thisimg
file="D:/pictures/"+str(i)+str(j)+".jpg"
urllib.request.urlretrieve(thisimgurl,filename=file)
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
5 个回复
臭屁小饼干 2018-11-26 回答
赞同来自:
184****7316 2018-11-26 回答
赞同来自:
5013mike 2019-03-04 回答
赞同来自:
url="https://s.taobao.com/search%3F ... 2Bstr(i*60)这个是什么意思?
梦蝶数据 2019-04-18 回答
赞同来自:
wuquanhui 2019-12-03 回答
赞同来自: