Python 标准库提供了 thread 和 threading 两个模块来对多线程进行支持。其中, thread 模块以低级、原始的方式来处理和控制线程,而 threading 模块通过对 thread 进行二次封装,提供了更方便的 api 来处理线程。 虽然使用 thread 没有 threading 来的方便,但它更灵活。今天先介绍 thread 模块的基本使用,下一篇 将介绍 threading 模块。
Thread
在介绍 thread 之前,先看一段代码,猜猜程序运行完成之后,在控制台上输出的结果是什么?
[python] view plain copy
1. [python] view plaincopy
2. #coding=gbk
3. import
4. count = 0
5. def
6. global
7. for i in xrange(10000):
8. 1
9. for i in range(10):
10. #如果对start_new_thread函数不是很了解,不要着急,马上就会讲解
11. time.sleep(3)
12. print count #count是多少呢?是10000 * 10 吗?
thread.start_new_thread ( function , args [ , kwargs ] )
函数将创建一个新的线程,并返回该线程的标识符(标识符为整数)。参数 function 表示线程创建之后,立即执行的函数,参数 args 是该函数的参数,它是一个元组类型;第二个参数 kwargs 是可选的,它为函数提供了命名参数字典。函数执行完毕之后,线程将自动退出。如果函数在执行过程中遇到未处理的异常,该线程将退出,但不会影响其他线程的执行。 下面是一个简单的例子:
[python] view plain copy
1. [python] view plaincopy
2. #coding=gbk
3. import
4. def threadFunc(a = None, b = None, c = None, d = None):
5. print time.strftime('%H:%M:%S', time.localtime()), a
6. 1)
7. print time.strftime('%H:%M:%S', time.localtime()), b
8. 1)
9. print time.strftime('%H:%M:%S', time.localtime()), c
10. 1)
11. print time.strftime('%H:%M:%S', time.localtime()), d
12. 1)
13. print time.strftime('%H:%M:%S', time.localtime()), 'over'
14.
15. thread.start_new_thread(threadFunc, (3, 4, 5, 6)) #创建线程,并执行threadFunc函数。
16. time.sleep(5)
thread.exit ()
结束当前线程。调用该函数会触发 SystemExit 异常,如果没有处理该异常,线程将结束。
thread.get_ident ()
返回当前线程的标识符,标识符是一个非零整数。
thread.interrupt_main ()
在主线程中触发 KeyboardInterrupt 异常。子线程可以使用该方法来中断主线程。下面的例子演示了在子线程中调用 interrupt_main ,在主线程中捕获异常 :
[python] view plain copy
1. [python] view plaincopy
2. import
3. thread.start_new_thread(lambda
4. try:
5. 2)
6. except
7. print 'error:', e
8. print 'over'
下面介绍 thread 模块中的琐,琐可以保证在任何时刻,最多只有一个线程可以访问共享资源。
thread.LockType 是 thread 模块中定义的琐类型。它有如下方法:
lock.acquire ( [ waitflag ] )
获取琐。函数返回一个布尔值,如果获取成功,返回 True ,否则返回 False 。参数 waitflag 的默认值是一个非零整数,表示如果琐已经被其他线程占用,那么当前线程将一直等待,只到其他线程释放,然后获取访琐。如果将参数 waitflag 置为 0 ,那么当前线程会尝试获取琐,不管琐是否被其他线程占用,当前线程都不会等待。
lock.release ()
释放所占用的琐。
lock.locked ()
判断琐是否被占用。
现在我们回过头来看文章开始处给出的那段代码:代码中定义了一个函数 threadTest ,它将全局变量逐一的增加 10000 ,然后在主线程中开启了 10 个子线程来调用 threadTest 函数。但结果并不是预料中的 10000 * 10 ,原因主要是对 count 的并发操作引来的。全局变量 count 是共享资源,对它的操作应该串行的进行。下面对那段代码进行修改,在对 count 操作的时候,进行加琐处理。看看程序运行的结果是否和预期一致。修改后的代码:
[python] view plain copy
1. [python] view plaincopy
2. #coding=gbk
3. import
4. count = 0
5. lock = thread.allocate_lock() #创建一个琐对象
6. def
7. global
8. #获取琐
9.
10. for i in xrange(10000):
11. 1
12.
13. #释放琐
14. for i in xrange(10):
15. thread.start_new_thread(threadTest, ())
16. time.sleep(3)
17. print
thread模块是不是并没有想像中的那么难!简单就是美,这就是Python。更多关于thread模块的内容,请参考Python手册 thread 模块
Threading
threading通过对thread模块进行二次封装,提供了更方便的API来操作线程。
threading.Thread
Thread 是threading模块中最重要的类之一,可以使用它来创建线程。有两种方式来创建线程:一种是通过继承Thread类,重写它的run方法;另一种是创建一个threading.Thread对象,在它的初始化函数(__init__)中将可调用对象作为参数传入。下面分别举例说明。先来看看通过继承threading.Thread类来创建线程的例子:
[python] view plain copy
1. [python] view plaincopy
2. #coding=gbk
3. import
4. count = 0
5. class
6. def __init__(self, lock, threadName):
7. '''''''@summary: 初始化对象。
8.
9. @param lock: 琐对象。
10. @param threadName: 线程名称。
11. '''
12. self).__init__(name = threadName) #注意:一定要显式的调用父类的初始
13. 化函数。
14. self.lock = lock
15.
16. def run(self):
17. '''''''@summary: 重写父类run方法,在线程启动后执行该方法内的代码。
18. '''
19. global
20. self.lock.acquire()
21. for i in xrange(10000):
22. 1
23. self.lock.release()
24. lock = threading.Lock()
25. for i in range(5):
26. "thread-"
27. time.sleep(2) #确保线程都执行完毕
28. print
在代码中,我们创建了一个Counter类,它继承了threading.Thread。初始化函数接收两个参数,一个是琐对象,另一个是线程的名称。在Counter中,重写了从父类继承的run方法,run方法将一个全局变量逐一的增加10000。在接下来的代码中,创建了五个Counter对象,分别调用其start方法。最后打印结果。这里要说明一下run方法 和start方法: 它们都是从Thread继承而来的,run()方法将在线程开启后执行,可以把相关的逻辑写到run方法中(通常把run方法称为活动[Activity]。);start()方法用于启动线程。
再看看另外一种创建线程的方法:
[python] view plain copy
1. [python] view plaincopy
2. import
3. count = 0
4. lock = threading.Lock()
5. def
6. '''''''@summary: 将全局变量count 逐一的增加10000。
7. '''
8. global
9. lock.acquire()
10. for i in xrange(10000):
11. 1
12. lock.release()
13. for i in range(5):
14. 'thread-'
15. time.sleep(2) #确保线程都执行完毕
16. print
在这段代码中,我们定义了方法doAdd,它将全局变量count 逐一的增加10000。然后创建了5个Thread对象,把函数对象doAdd 作为参数传给它的初始化函数,再调用Thread对象的start方法,线程启动后将执行doAdd函数。这里有必要介绍一下threading.Thread类的初始化函数原型:
def __init__(self, group=None, target=None, name=None, args=(), kwargs={})
参数group是预留的,用于将来扩展;
参数target是一个可调用对象(也称为活动[activity]),在线程启动后执行;
参数name是线程的名字。默认值为“Thread-N“,N是一个数字。
参数args和kwargs分别表示调用target时的参数列表和关键字参数
Thread类还定义了以下常用方法与属性:
Thread.getName()
Thread.setName()
Thread.name
用于获取和设置线程的名称。
Thread.ident
获取线程的标识符。线程标识符是一个非零整数,只有在调用了start()方法之后该属性才有效,否则它只返回None。
Thread.is_alive()
Thread.isAlive()
判断线程是否是激活的(alive)。从调用start()方法启动线程,到run()方法执行完毕或遇到未处理异常而中断 这段时间内,线程是激活的。
Thread.join([timeout])
调用Thread.join将会使主调线程堵塞,直到被调用线程运行结束或超时。参数timeout是一个数值类型,表示超时时间,如果未提供该参数,那么主调线程将一直堵塞到被调线程结束。下面举个例子说明join()的使用:
[python] view plain copy
1. [python] view plaincopy
2. import
3. def
4. print 'start waiting:', time.strftime('%H:%M:%S')
5. 3)
6. print 'stop waiting', time.strftime('%H:%M:%S')
7. thread1 = threading.Thread(target = doWaiting)
8. thread1.start()
9. time.sleep(1) #确保线程thread1已经启动
10. print 'start join'
11. thread1.join() #将一直堵塞,直到thread1运行结束。
12. print 'end join'
threading.RLock和threading.Lock
在threading模块中,定义两种类型的琐:threading.Lock和threading.RLock。它们之间有一点细微的区别,通过比较下面两段代码来说明:
[python] view plain copy
1. [python] view plaincopy
2. import
3. lock = threading.Lock() #Lock对象
4. lock.acquire()
5. lock.acquire() #产生了死琐。
6. lock.release()
7. lock.release()
8.
9.
10. [python] view plaincopy
11. import
12. rLock = threading.RLock() #RLock对象
13. rLock.acquire()
14. rLock.acquire() #在同一线程内,程序不会堵塞。
15. rLock.release()
16. rLock.release()
这两种琐的主要区别是:RLock允许在同一线程中被多次acquire。而Lock却不允许这种情况。注意:如果使用RLock,那么acquire和release必须成对出现,即调用了n次acquire,必须调用n次的release才能真正释放所占用的琐。
threading.Condition
可以把Condiftion理解为一把高级的琐,它提供了比Lock, RLock更高级的功能,允许我们能够控制复杂的线程同步问题。threadiong.Condition在内部维护一个琐对象(默认是RLock),可以在创建Condigtion对象的时候把琐对象作为参数传入。Condition也提供了acquire, release方法,其含义与琐的acquire, release方法一致,其实它只是简单的调用内部琐对象的对应的方法而已。Condition还提供了如下方法(特别要注意:这些方法只有在占用琐(acquire)之后才能调用,否则将会报RuntimeError异常。):
Condition.wait([timeout]):
wait方法释放内部所占用的琐,同时线程被挂起,直至接收到通知被唤醒或超时(如果提供了timeout参数的话)。当线程被唤醒并重新占有琐的时候,程序才会继续执行下去。
Condition.notify():
唤醒一个挂起的线程(如果存在挂起的线程)。注意:notify()方法不会释放所占用的琐。
Condition.notify_all()
Condition.notifyAll()
唤醒所有挂起的线程(如果存在挂起的线程)。注意:这些方法不会释放所占用的琐。
现在写个捉迷藏的游戏来具体介绍threading.Condition的基本使用。假设这个游戏由两个人来玩,一个藏(Hider),一个找(Seeker)。游戏的规则如下:1. 游戏开始之后,Seeker先把自己眼睛蒙上,蒙上眼睛后,就通知Hider;2. Hider接收通知后开始找地方将自己藏起来,藏好之后,再通知Seeker可以找了; 3. Seeker接收到通知之后,就开始找Hider。Hider和Seeker都是独立的个体,在程序中用两个独立的线程来表示,在游戏过程中,两者之间的行为有一定的时序关系,我们通过Condition来控制这种时序关系。
[python] view plain copy
1. [python] view plaincopy
2. #---- Condition
3. #---- 捉迷藏的游戏
4. import
5. class
6. def __init__(self, cond, name):
7. self).__init__()
8. self.cond = cond
9. self.name = name
10.
11. def run(self):
12. 1) #确保先运行Seeker中的方法
13.
14. self.cond.acquire() #b
15. print self.name + ': 我已经把眼睛蒙上了'
16. self.cond.notify()
17. self.cond.wait() #c
18. #f
19. print self.name + ': 我找到你了 ~_~'
20. self.cond.notify()
21. self.cond.release()
22. #g
23. print self.name + ': 我赢了' #h
24.
25. class
26. def __init__(self, cond, name):
27. self).__init__()
28. self.cond = cond
29. self.name = name
30. def run(self):
31. self.cond.acquire()
32. self.cond.wait() #a #释放对琐的占用,同时线程挂起在这里,直到被notify并重新占有琐。
33. #d
34. print self.name + ': 我已经藏好了,你快来找我吧'
35. self.cond.notify()
36. self.cond.wait() #e
37. #h
38. self.cond.release()
39. print self.name + ': 被你找到了,哎~~~'
40.
41. cond = threading.Condition()
42. seeker = Seeker(cond, 'seeker')
43. hider = Hider(cond, 'hider')
44. seeker.start()
45. hider.start()
threading.Event
Event实现与Condition类似的功能,不过比Condition简单一点。它通过维护内部的标识符来实现线程间的同步问题。(threading.Event和.NET中的System.Threading.ManualResetEvent类实现同样的功能。)
Event.wait([timeout])
堵塞线程,直到Event对象内部标识位被设为True或超时(如果提供了参数timeout)。
Event.set()
将标识位设为Ture
Event.clear()
将标识伴设为False。
Event.isSet()
判断标识位是否为Ture。
下面使用Event来实现捉迷藏的游戏(可能用Event来实现不是很形象)
[python] view plain copy
1. [python] view plaincopy
2. #---- Event
3. #---- 捉迷藏的游戏
4. import
5. class
6. def __init__(self, cond, name):
7. self).__init__()
8. self.cond = cond
9. self.name = name
10.
11. def run(self):
12. 1) #确保先运行Seeker中的方法
13.
14. print self.name + ': 我已经把眼睛蒙上了'
15.
16. self.cond.set()
17.
18. 1)
19.
20. self.cond.wait()
21. print self.name + ': 我找到你了 ~_~'
22.
23. self.cond.set()
24.
25. print self.name + ': 我赢了'
26.
27. class
28. def __init__(self, cond, name):
29. self).__init__()
30. self.cond = cond
31. self.name = name
32. def run(self):
33. self.cond.wait()
34.
35. print self.name + ': 我已经藏好了,你快来找我吧'
36. self.cond.set()
37.
38. 1)
39. self.cond.wait()
40.
41. print self.name + ': 被你找到了,哎~~~'
42.
43. cond = threading.Event()
44. seeker = Seeker(cond, 'seeker')
45. hider = Hider(cond, 'hider')
46. seeker.start()
47. hider.start()
48.
49.
50. threading.Timer
51. threading.Timer是threading.Thread的子类,可以在指定时间间隔后执行某个操作。下面是Python手册上提供的一个例子:
52.
53.
54. [python] view plaincopy
55. def
56. print "hello, world"
57. t = Timer(3, hello)
58. t.start() # 3秒钟之后执行hello函数。
threading模块中还有一些常用的方法没有介绍:
threading.active_count()
threading.activeCount()
获取当前活动的(alive)线程的个数。
threading.current_thread()
threading.currentThread()
获取当前的线程对象(Thread object)。
threading.enumerate()
获取当前所有活动线程的列表。
threading.settrace(func)
设置一个跟踪函数,用于在run()执行之前被调用。
threading.setprofile(func)
设置一个跟踪函数,用于在run()执行完毕之后调用。
threading模块的内容很多,一篇文章很难写全,更多关于threading模块的信息,请查询Python手册 threading 模块。