ThreadLocal
在多线程环境下,每个线程都有自己的数据。局部变量只有线程自己能看到,不会影响其他线程,而全局变量的修改必须加锁。
ThreadLocal变量虽然是全局变量,但每个线程都只能读写自己的线程的独立副本,互不干扰。ThreadLocal解决了参数在一个线程中的各个函数之间互相传递的问题。
ThreadLocal最常用的地方就是为每个线程绑定一个数据库连接,HTTP请求,用户身份信息等,这样一个线程的所有调用到的处理函数都可以非常方便的访问这些资源了。
多进程VS多线程
实现多任务,我们通常采用Master-Worker模式,Master负责分配任务,Worker负责执行任务,因此,在多任务环境下,通常是一个Master,多个Worker。
在多进程和多线程中实现Master-Worker,主进程或主线程是Master,其他进程或线程是Worker。
线程切换
多进程还是多线程,数量一多,效率肯定上不去。
计算密集型 VS IO密集型
异步IO
用来解决CPU和IO之间最大的速度差异。
如果充分利用操作系统提供的异步IO支持,就可以用单进程或单线程模型来执行多任务,这种全新的模型称为事件驱动模型。Nginx就是支持异步IO的Web服务器。
在Python中,单线程的异步编程模型称为协程,有了协程的支持,就可以基于事件驱动编写高效的多任务程序。
分布式进程
总结:
Python的分布式进程接口简单,封装良好,适合需要把繁重任务分布到多台机器的环境下。
注意:Queue的作用是用来传递任务和接收结果,每个任务的描述数据量要尽量小。例如:发送一个处理日志文件的任务,就不要发送几百兆的人日志文件本身,而是发送日志文件存放的完整路径,由Worker进程再去共享磁盘上读取文件。