0
推荐
1665
阅读
用Python读写文件,看这篇就够
本文为译文,原文链接 read-write-files-python 本人博客: 编程禅师使用Python做的最常见的任务是读取和写入文件。无论是写入简单的文本文件,读取复杂的服务器日志,还是分析原始的字节数据。所有这些情况都需要读取或写入文件。在本教程中,你将学习:文件的构成以及为什么这在Python中很重要Python中读取和写入文件的...
0
推荐
2681
阅读
Python邮件发送,看这篇就够
本文为译文,原文链接 Sending Emails With Python本人博客: 编程禅师你可能因为想使用Python发送电子邮件而找到了本教程。 也许你希望写代码来接收邮件提醒,在用户创建帐户时向用户发送确认邮件,或向组织成员发送邮件以提醒他们支付会费。 发送邮件是一项耗时且容易出错的任务,但是使用Python可以轻松实现自动化。在...
0
推荐
1731
阅读
Requests库使用指南
本文为译文,原文链接 python-requests-library-guide 本人博客: 编程禅师requests 库是用来在Python中发出标准的HTTP请求。 它将请求背后的复杂性抽象成一个漂亮,简单的API,以便你可以专注于与服务交互和在应用程序中使用数据。在本文中,你将看到 requests 提供的一些有用的功能,以及如何针对你可能遇到的不同情况...
1
推荐
2254
阅读
Python文件操作,看这篇就足够
微信公众号:代码与艺术本文为译文,原文链接 working-with-files-in-pythonPython中有几个内置模块和方法来处理文件。这些方法被分割到例如os, os.path , shutil 和 pathlib 等等几个模块中。文章将列举Python中对文件最常用的操作和方法。在这篇文章中,你将学习如何:获取文件属...
5
推荐
4121
阅读
Scrapy 爬取伯乐在线实战
项目介绍使用Scrapy框架进行爬取伯乐在线的所有技术文章所用知识点Scrapy项目的创建Scrapy框架Shell命令的使用Scrapy自带的图片下载管道Scrapy自定义图片下载管道(继承自带的管道)Scrapy框架ItemLoader的使用Scrapy自定义ItemLoaderScrapy中同步将Item保存入Mysq数据库Scrapy中异步将Item保存入Mysq数据库项目初始创建新...
6
推荐
3306
阅读
Selenium 爬取淘宝实战练习
1、项目流程2、中心调度# 中心调度def main(): try: total = search() total = int(re.compile('.*?(\d+).*?').search(total).group(1)) for i in range(2,total+1): next_page(i) except Exception as e: print('异常') finally: browser.close()3、模拟查询# ...
3
推荐
2289
阅读
Selenium 库学习笔记
1、基本使用from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.wait import WebDriverWaitbrowser = webdriver.Chrome()browser.get('https://www.taobao.com/')# 显示等待10swait = WebDri...
2
推荐
2180
阅读
PyQuery 库学习笔记
1、初始化1.1、字符串初始化from pyquery import PyQuery as pyhtml = '''<div> <ul> <li class="item-0">first item</li> <li class="item-1"><a href="https://ask.hellobi.com/link2.html">second item</a></li> <li class="item-0 active"><a href="https://ask.hellobi.com/li...
3
推荐
2156
阅读
今日头条街拍爬取练习
本次练习使用到的知识点有* Requests 库的使用* BeautifulShop 库的使用* 正则表达式的使用* pymongo 库的使用1、项目流程分析2、中心调度# 中心调度def main(offset): # 获取列表页 index_data = get_page_index(offset,KEYWORDS) if index_data is None: print("offset:"+offset+"异常") retur...
1
推荐
2642
阅读
BeautifulSoup 库学习笔记
1、常用解析库2、BeautifulSoup的基本使用from bs4 import BeautifulSouphtml = """<html><head><title>The Dormouse's story</title></head><body><p class="title" name="dromouse"><b>The Dormouse's story</b></p><p class="story">Once upon a ...
6
推荐
2449
阅读
猫眼电影TOP100爬取练习
本次练习使用到的知识点Requsts 库的基本使用正则表达式的使用Python3写入CSV1、项目流程分析2、中心调度# 主调度程序
def main():
# 起始URL
start_url = 'http://maoyan.com/board/4'
for i in range(0,100,10):
# 获取响应文本内容
html = get_one_page(url=start_url, offset=i)
...
1
推荐
1863
阅读
Requests 库学习笔记
1、概览1.1、实例引入# 引入Requests库
import requests
# 发起GET请求
response = requests.get('https://www.baidu.com/')
# 查看响应类型 requests.models.Response
print(type(response))
# 输出状态码
print(response.status_code)
# 输出响应内容类型 text
print(type(response.text))
# 输出响应内容
print(re...