请问Python中的html.parser怎样直接对网页上的HTML进行解析,我在网上查到的代码都是在作者自己给的一个html上做的解析。

0
比如:
QQ图片20170718152437.png
已邀请:
0

Infor 2017-07-19 回答

 你直接看下这个 BeautifulSoup  函数哈 from bs4 import BeautifulSoup 
# HTML代码的 
 html = '\
<html>\
<body>\
<h1 id ="title> Hello world </h1>\
</body>\
</html>'
# HTML代码的 
soup = BeautifulSoup(html,'html.parser')
print (soup.text)
输出结果 : Hello world
0

roddicki 2017-10-13 回答

爬虫的第一个步骤是抓取,可以用requests或urllib2去实现,后续才是页面分析

要回复问题请先登录注册