Python-线程

浏览: 1782

1.线程

Python中使用线程有两种方式:函数或者用类来包装线程对象。

1.函数式:调用thread模块中的start_new_thread()函数来产生新线程。

语法如下:

thread.start_new_thread(function,args[,kwargs])

参数说明:

  • function - 线程函数。

  • args - 传递给线程函数的参数,他必须是个tuple类型。

  • kwargs - 可选参数。

2.线程模块

Python通过两个标准库threadthreading提供对线程的支持。thread提供了低级别的、原始的线程以及一个简单的锁。

thread 模块提供的其他方法:

  • threading.currentThread(): 返回当前的线程变量。

  • threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。

  • threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。

除了使用方法外,线程模块同样提供了Thread类来处理线程,Thread类提供了以下方法:

  • run():用以表示线程活动的方法。

  • start():启动线程活动。

  • join([time]):等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。

  • isAlive():返回线程是否活动的。

  • getName():返回线程名。

  • setName():设置线程名。

3.线程优先级队列( Queue)

Python的Queue模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue。这些队列都实现了锁原语,能够在多线程中直接使用。可以使用队列来实现线程间的同步。

Queue模块中的常用方法:

  • Queue.qsize() 返回队列的大小

  • Queue.empty() 如果队列为空,返回True,反之False

  • Queue.full() 如果队列满了,返回True,反之False

  • Queue.full 与 maxsize 大小对应

  • Queue.get([block[, timeout]])获取队列,timeout等待时间

  • Queue.get_nowait() 相当Queue.get(False)

  • Queue.put(item) 写入队列,timeout等待时间

  • Queue.put_nowait(item) 相当Queue.put(item, False)

  • Queue.task_done() 在完成一项工作之后,Queue.task_done()函数向任务已经完成的队列发送一个信号

  • Queue.join() 实际上意味着等到队列为空,再执行别的操作

2.多线程-threading

python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用

1.使用threading模块

单线程执行:

import time


def say_words():
print('千万不要给自己懒散的生活态度,找任何借口。 %s' % time.ctime())
time.sleep(1)


if __name__ == '__main__':
for i in range(5):
say_words()

运行结果:

千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:11:04 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:11:05 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:11:06 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:11:07 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:11:08 2018
多线程执行:

import time
import threading


def say_words():
print('千万不要给自己懒散的生活态度,找任何借口。 %s' % time.ctime())
time.sleep(1)


if __name__ == '__main__':
for i in range(5):
t = threading.Thread(target=say_words)
t.start() # 启动线程,即让线程开始执行

运行结果:

千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度,找任何借口。 Thu Jun 28 09:12:59 2018

说明:

1.可以明显看出使用了多线程并发的操作,花费时间要短很多

2.创建好的线程,需要调用start()方法来启动

3.主线程会等待所有的子线程结束后才结束

import threading
from time import sleep, ctime


def sing():
for i in range(3):
print('我正在唱歌 %d' % i)
sleep(1)


def dance():
for i in range(3):
print('我正在跳舞...%d' % i)
sleep(1)


if __name__ == '__main__':
print('开始:%s' % ctime())

t1 = threading.Thread(target=sing)
t2 = threading.Thread(target=dance)

t1.start()
t2.start()

sleep(5)
print('结束:%s' % ctime())

运行结果:

开始:Thu Jun 28 09:19:27 2018
我正在唱歌 0
我正在跳舞...0
我正在跳舞...1
我正在唱歌 1
我正在跳舞...2
我正在唱歌 2
结束:Thu Jun 28 09:19:32 2018

通过结果我们会发现主线程会等到子线程结束后结束

4.查看线程数量

我们可以通过用threading.enumerate()来查看线程的数量

import threading
from time import sleep, ctime


def sing():
for i in range(3):
print('我正在唱歌 %d' % i)
sleep(1)


def dance():
for i in range(3):
print('我正在跳舞...%d' % i)
sleep(1)


if __name__ == '__main__':
print('开始:%s' % ctime())

t1 = threading.Thread(target=sing)
t2 = threading.Thread(target=dance)

t1.start()
t2.start()

while True:
length = len(threading.enumerate())
print('当前运行的线程数为:%d' % length)
if length <= 1:
break

sleep(0.5)

运行结果:

开始:Thu Jun 28 09:26:28 2018
我正在唱歌 0
当前运行的线程数为:3
我正在跳舞...0
当前运行的线程数为:3
我正在唱歌 1
我正在跳舞...1
当前运行的线程数为:3
当前运行的线程数为:3
我正在跳舞...2
我正在唱歌 2
当前运行的线程数为:3
当前运行的线程数为:3
当前运行的线程数为:1

5.threading注意点

1.线程执行代码的封装

通过上一小节,能够看出,通过使用threading模块能完成多任务的程序开发,为了让每个线程的封装性更完美,所以使用threading模块时,往往会定义一个新的子类class,只要继承threading.Thread就可以了,然后重写run方法

threading.Thread

Thread是threading模块中最重要的类之一,可以使用它来创建线程。有两种方式来创建线程:一种是通过继承Thread类,重写它的run方法;另一种是创建一个threading.Thread对象,在它的初始化函数(__init__)中将可调用对象作为参数传入。

import threading
import time


class my_thread(threading.Thread):
def run(self):
for i in range(3):
time.sleep(1)
msg = 'My ' + self.name + ' @ ' + str(i) # name属性中保存的是当前线程的名字
print(msg)


if __name__ == '__main__':
t = my_thread()
t.start()

运行结果:

My Thread-1 @ 0
My Thread-1 @ 1
My Thread-1 @ 2

说明:

python的threading.Thread类有一个run方法,用于定义线程的功能函数,可以在自己的线程类中覆盖该方法。而创建自己的线程实例后,通过Thread类的start方法,可以启动该线程,交给python虚拟机进行调度,当该线程获得执行的机会时,就会调用run方法执行线程。

def__init__(self, group=None, target=None, name=None, args=(), kwargs={})

1.参数group是预留的,用于将来扩展;

2.参数target是一个可调用对象(也称为活动[activity]),在线程启动后执行;

3.参数name是线程的名字。默认值为“Thread-N“,N是一个数字。

4.参数args和kwargs分别表示调用target时的参数列表和关键字参数。

5.Thread类还定义了以下常用方法与属性:

1.Thread.getName()

2.Thread.setName()

3.Thread.name 用于获取和设置线程的名称。
Thread.ident

获取线程的标识符。线程标识符是一个非零整数,只有在调用了start()方法之后该属性才有效,否则它只返回None

1.Thread.is_alive()

2.Thread.isAlive()

判断线程是否是激活的(alive)。从调用start()方法启动线程,到run()方法执行完毕或遇到未处理异常而中断 这段时间内,线程是激活的。

Thread.join([timeout])

调用Thread.join将会使主调线程堵塞,直到被调用线程运行结束或超时。参数timeout是一个数值类型,表示超时时间,如果未提供该参数,那么主调线程将一直堵塞到被调线程结束。

由于任何进程默认就会启动一个线程,我们把该线程称为主线程,主线程又可以启动新的线程,Python的threading模块有个current_thread()函数,它永远返回当前线程的实例。主线程实例的名字叫MainThread,子线程的名字在创建时指定,我们用LoopThread命名子线程。名字仅仅在打印时用来显示,完全没有其他意义,如果不起名字Python就自动给线程命名为Thread-1Thread-2……

2.线程的执行顺序

import threading
import time


class my_thread(threading.Thread):
def run(self):
for i in range(3):
time.sleep(1)
msg = 'My ' + self.name + ' @ ' + str(i) # name属性中保存的是当前线程的名字
print(msg)


def test():
for i in range(5):
t = my_thread()
t.start()


if __name__ == '__main__':
test()

运行结果:

My Thread-1 @ 0
My Thread-2 @ 0
My Thread-4 @ 0
My Thread-5 @ 0
My Thread-3 @ 0
My Thread-2 @ 1
My Thread-3 @ 1
My Thread-1 @ 1
My Thread-5 @ 1
My Thread-4 @ 1
My Thread-2 @ 2
My Thread-4 @ 2
My Thread-5 @ 2
My Thread-1 @ 2
My Thread-3 @ 2

说明:

从代码和执行结果我们可以看出,多线程程序的执行顺序是不确定的。当执行到sleep语句时,线程将被阻塞(Blocked),到sleep结束后,线程进入就绪(Runnable)状态,等待调度。而线程调度将自行选择一个线程执行。上面的代码中只能保证每个线程都运行完整个run函数,但是线程的启动顺序、run函数中每次循环的执行顺序都不能确定。

总结

1.每个线程一定会有一个名字,尽管上面的例子中没有指定线程对象的name,但是python会自动为线程指定一个名字。

2.当线程的run()方法结束时该线程完成。

3.无法控制线程调度程序,但可以通过别的方式来影响线程调度的方式。

4.线程的几种状态

6.多线程-共享全局变量

import threading
import time

global_num = 520

def work_1():
global global_num
for i in range(3):
global_num += 1

print('-- in work_1,global_num is %d' % global_num)


def work_2():
global global_num

print('-- in work_2,global_num is %d' % global_num)


print('-- 线程创建之前global_num is %d ' % global_num)


t1 = threading.Thread(target=work_1)
t1.start()

# 设置休眠时间,保证t1线程中的代码运行完
time.sleep(1)

t2 = threading.Thread(target=work_2)
t2.start()

运行结果:

-- 线程创建之前global_num is 520
-- in work_1,global_num is 523
-- in work_2,global_num is 523

7.列表当做实参传递到线程中

import time
from threading import Thread

def work_1(nums):
nums.append(44)
print('-- In work_1, ', nums)


def work_2(nums):
# 设置休眠时间
time.sleep(1)
print('-- In work_2, ', nums)


globals_nums = [11, 22, 33]

t1 = Thread(target=work_1, args=(globals_nums,))
t1.start()

t2 = Thread(target=work_2, args=(globals_nums,))
t2.start()

运行结果:

-- In work_1, [11, 22, 33, 44]
-- In work_2, [11, 22, 33, 44]

总结:

  • 在一个进程内的所有线程共享全局变量,能够在不适用其他方式的前提下完成多线程之间的数据共享(这点要比多进程要好)

  • 缺点就是,线程是对全局变量随意遂改可能造成多线程之间对全局变量的混乱(即线程非安全)

推荐 0
本文由 一只写程序的猿 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册