Python爬虫之九派新闻

发表: 2017-03-06 浏览: 1639

Python 爬虫

以前一直不知道如何爬取动态内容，知道看了@Lerther 的文章，才知道。下面拿九派新闻来试试。原文知乎专栏

Clipboard Image.png

1、寻找URL

进入九派新闻内容页九派号，“F12”——“Network”——“F5”，勾选“XHR”，发现多个文件。

Clipboard Image.png

经过一个一个寻找，在Preview中先测试，发现就是内容页的新闻，打开Headers，寻找我们要的URL，GET请求。

Clipboard Image.png

2、爬取内容

先上代码

import requests

import json





url = 'http://appjph.jiupaicn.com/app/content/recommend_pc/list?deviceId=888&type=1&page=1&pageSize=15&_=1485163767294'

webdata = requests.get(url).text



data = json.loads(webdata)

news = data['resultData']



for n in news:

	title = n['title']

	name = n['memberName']

	News_url = 'http://jphao.jiupaicn.com/index.php?m=content&c=jiupaihao&a=article&' + '&id=' + n['id'] + '&memberId=' + n['memberId']

	print(title,name,News_url)