Python-线程

发表: 2017-10-13 浏览: 1782

Python

1.线程

Python中使用线程有两种方式：函数或者用类来包装线程对象。

1.函数式：调用thread模块中的start_new_thread()函数来产生新线程。

语法如下:

thread.start_new_thread(function,args[,kwargs])

参数说明:

function - 线程函数。
args - 传递给线程函数的参数,他必须是个tuple类型。
kwargs - 可选参数。

2.线程模块

Python通过两个标准库thread和threading提供对线程的支持。thread提供了低级别的、原始的线程以及一个简单的锁。

thread 模块提供的其他方法：

threading.currentThread(): 返回当前的线程变量。
threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前，不包括启动前和终止后的线程。
threading.activeCount(): 返回正在运行的线程数量，与len(threading.enumerate())有相同的结果。

除了使用方法外，线程模块同样提供了Thread类来处理线程，Thread类提供了以下方法:

run():用以表示线程活动的方法。
start():启动线程活动。
join([time]):等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。
isAlive():返回线程是否活动的。
getName():返回线程名。
setName():设置线程名。

3.线程优先级队列（ Queue）

Python的Queue模块中提供了同步的、线程安全的队列类，包括FIFO（先入先出)队列Queue，LIFO（后入先出）队列LifoQueue，和优先级队列PriorityQueue。这些队列都实现了锁原语，能够在多线程中直接使用。可以使用队列来实现线程间的同步。

Queue模块中的常用方法:

Queue.qsize() 返回队列的大小
Queue.empty() 如果队列为空，返回True,反之False
Queue.full() 如果队列满了，返回True,反之False
Queue.full 与 maxsize 大小对应
Queue.get([block[, timeout]])获取队列，timeout等待时间
Queue.get_nowait() 相当Queue.get(False)
Queue.put(item) 写入队列，timeout等待时间
Queue.put_nowait(item) 相当Queue.put(item, False)
Queue.task_done() 在完成一项工作之后，Queue.task_done()函数向任务已经完成的队列发送一个信号
Queue.join() 实际上意味着等到队列为空，再执行别的操作

2.多线程-threading

python的thread模块是比较底层的模块，python的threading模块是对thread做了一些包装的，可以更加方便的被使用

1.使用threading模块

单线程执行：

import time





def say_words():

    print('千万不要给自己懒散的生活态度，找任何借口。 %s' % time.ctime())

    time.sleep(1)





if __name__ == '__main__':

    for i in range(5):

        say_words()

运行结果：

千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:11:04 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:11:05 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:11:06 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:11:07 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:11:08 2018
多线程执行：

import time

import threading





def say_words():

    print('千万不要给自己懒散的生活态度，找任何借口。 %s' % time.ctime())

    time.sleep(1)





if __name__ == '__main__':

    for i in range(5):

        t = threading.Thread(target=say_words)

        t.start()   # 启动线程,即让线程开始执行

运行结果：

千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:12:59 2018
千万不要给自己懒散的生活态度，找任何借口。 Thu Jun 28 09:12:59 2018

说明：

1.可以明显看出使用了多线程并发的操作，花费时间要短很多

2.创建好的线程，需要调用start()方法来启动

3.主线程会等待所有的子线程结束后才结束

import threading

from time import sleep, ctime





def sing():

    for i in range(3):

        print('我正在唱歌 %d' % i)

        sleep(1)





def dance():

    for i in range(3):

        print('我正在跳舞...%d' % i)

        sleep(1)





if __name__ == '__main__':

    print('开始：%s' % ctime())



    t1 = threading.Thread(target=sing)

    t2 = threading.Thread(target=dance)



    t1.start()

    t2.start()



    sleep(5)

    print('结束：%s' % ctime())

运行结果：

开始：Thu Jun 28 09:19:27 2018
我正在唱歌 0
我正在跳舞...0
我正在跳舞...1
我正在唱歌 1
我正在跳舞...2
我正在唱歌 2
结束：Thu Jun 28 09:19:32 2018

通过结果我们会发现主线程会等到子线程结束后结束

4.查看线程数量

我们可以通过用threading.enumerate()来查看线程的数量

import threading

from time import sleep, ctime





def sing():

    for i in range(3):

        print('我正在唱歌 %d' % i)

        sleep(1)





def dance():

    for i in range(3):

        print('我正在跳舞...%d' % i)

        sleep(1)





if __name__ == '__main__':

    print('开始：%s' % ctime())



    t1 = threading.Thread(target=sing)

    t2 = threading.Thread(target=dance)



    t1.start()

    t2.start()



    while True:

        length = len(threading.enumerate())

        print('当前运行的线程数为：%d' % length)

        if length <= 1:

            break



        sleep(0.5)

运行结果：

开始：Thu Jun 28 09:26:28 2018
我正在唱歌 0
当前运行的线程数为：3
我正在跳舞...0
当前运行的线程数为：3
我正在唱歌 1
我正在跳舞...1
当前运行的线程数为：3
当前运行的线程数为：3
我正在跳舞...2
我正在唱歌 2
当前运行的线程数为：3
当前运行的线程数为：3
当前运行的线程数为：1

5.threading注意点

1.线程执行代码的封装

通过上一小节，能够看出，通过使用threading模块能完成多任务的程序开发，为了让每个线程的封装性更完美，所以使用threading模块时，往往会定义一个新的子类class，只要继承threading.Thread就可以了，然后重写run方法

threading.Thread

Thread是threading模块中最重要的类之一，可以使用它来创建线程。有两种方式来创建线程：一种是通过继承Thread类，重写它的run方法；另一种是创建一个threading.Thread对象，在它的初始化函数（__init__）中将可调用对象作为参数传入。

import threading

import time





class my_thread(threading.Thread):

    def run(self):

        for i in range(3):

            time.sleep(1)

            msg = 'My ' + self.name + ' @ ' + str(i)  # name属性中保存的是当前线程的名字

            print(msg)





if __name__ == '__main__':

    t = my_thread()

    t.start()

运行结果：

My Thread-1 @ 0
My Thread-1 @ 1
My Thread-1 @ 2

说明：

python的threading.Thread类有一个run方法，用于定义线程的功能函数，可以在自己的线程类中覆盖该方法。而创建自己的线程实例后，通过Thread类的start方法，可以启动该线程，交给python虚拟机进行调度，当该线程获得执行的机会时，就会调用run方法执行线程。

def__init__(self, group=None, target=None, name=None, args=(), kwargs={})



1.参数group是预留的，用于将来扩展；



2.参数target是一个可调用对象（也称为活动[activity]），在线程启动后执行；



3.参数name是线程的名字。默认值为“Thread-N“，N是一个数字。



4.参数args和kwargs分别表示调用target时的参数列表和关键字参数。



5.Thread类还定义了以下常用方法与属性：



    1.Thread.getName()



    2.Thread.setName()



    3.Thread.name 用于获取和设置线程的名称。

Thread.ident



获取线程的标识符。线程标识符是一个非零整数，只有在调用了start()方法之后该属性才有效，否则它只返回None。



1.Thread.is_alive()



2.Thread.isAlive()



判断线程是否是激活的（alive）。从调用start()方法启动线程，到run()方法执行完毕或遇到未处理异常而中断 这段时间内，线程是激活的。



Thread.join([timeout])



调用Thread.join将会使主调线程堵塞，直到被调用线程运行结束或超时。参数timeout是一个数值类型，表示超时时间，如果未提供该参数，那么主调线程将一直堵塞到被调线程结束。

由于任何进程默认就会启动一个线程，我们把该线程称为主线程，主线程又可以启动新的线程，Python的threading模块有个current_thread()函数，它永远返回当前线程的实例。主线程实例的名字叫MainThread，子线程的名字在创建时指定，我们用LoopThread命名子线程。名字仅仅在打印时用来显示，完全没有其他意义，如果不起名字Python就自动给线程命名为Thread-1，Thread-2……

2.线程的执行顺序

import threading

import time





class my_thread(threading.Thread):

    def run(self):

        for i in range(3):

            time.sleep(1)

            msg = 'My ' + self.name + ' @ ' + str(i)  # name属性中保存的是当前线程的名字

            print(msg)





def test():

    for i in range(5):

        t = my_thread()

        t.start()





if __name__ == '__main__':

    test()

运行结果：

My Thread-1 @ 0
My Thread-2 @ 0
My Thread-4 @ 0
My Thread-5 @ 0
My Thread-3 @ 0
My Thread-2 @ 1
My Thread-3 @ 1
My Thread-1 @ 1
My Thread-5 @ 1
My Thread-4 @ 1
My Thread-2 @ 2
My Thread-4 @ 2
My Thread-5 @ 2
My Thread-1 @ 2
My Thread-3 @ 2

说明:

从代码和执行结果我们可以看出，多线程程序的执行顺序是不确定的。当执行到sleep语句时，线程将被阻塞（Blocked），到sleep结束后，线程进入就绪（Runnable）状态，等待调度。而线程调度将自行选择一个线程执行。上面的代码中只能保证每个线程都运行完整个run函数，但是线程的启动顺序、run函数中每次循环的执行顺序都不能确定。

总结

1.每个线程一定会有一个名字，尽管上面的例子中没有指定线程对象的name，但是python会自动为线程指定一个名字。

2.当线程的run()方法结束时该线程完成。

3.无法控制线程调度程序，但可以通过别的方式来影响线程调度的方式。

4.线程的几种状态

6.多线程-共享全局变量

import threading

import time



global_num = 520



def work_1():

    global global_num

    for i in range(3):

        global_num += 1



    print('-- in work_1,global_num is %d' % global_num)





def work_2():

    global global_num



    print('-- in work_2,global_num is %d' % global_num)





print('-- 线程创建之前global_num is %d ' % global_num)





t1 = threading.Thread(target=work_1)

t1.start()



# 设置休眠时间，保证t1线程中的代码运行完

time.sleep(1)



t2 = threading.Thread(target=work_2)

t2.start()

运行结果：

-- 线程创建之前global_num is 520
-- in work_1,global_num is 523
-- in work_2,global_num is 523

7.列表当做实参传递到线程中

import time

from threading import Thread



def work_1(nums):

    nums.append(44)

    print('-- In work_1, ', nums)





def work_2(nums):

    # 设置休眠时间

    time.sleep(1)

    print('-- In work_2, ', nums)





globals_nums = [11, 22, 33]



t1 = Thread(target=work_1, args=(globals_nums,))

t1.start()



t2 = Thread(target=work_2, args=(globals_nums,))

t2.start()

运行结果:

-- In work_1, [11, 22, 33, 44]
-- In work_2, [11, 22, 33, 44]

总结：

在一个进程内的所有线程共享全局变量，能够在不适用其他方式的前提下完成多线程之间的数据共享（这点要比多进程要好）
缺点就是，线程是对全局变量随意遂改可能造成多线程之间对全局变量的混乱（即线程非安全）

0 个评论

要回复文章请先登录或注册