据廖雪峰老师的学习文档介绍,高级语言通常都内置多线程的支持,Python也不例外,并且,Python的线程是真正的Posix Thread,而不是模拟出来的线程。
Python的标准库提供了两个模块:_thread
和threading
,_thread
是低级模块,threading
是高级模块,对_thread
进行了封装。绝大多数情况下,我们只需要使用threading
这个高级模块。
启动一个线程就是把一个函数传入并创建Thread
实例,然后调用start()
开始执行。
下面学习笔记从有四个板块知识点:
- _thread模块来做简单尝试
- 线程同步:锁
- threading来class实例化创建多线程
- threading的线程优先级队列
Python中使用线程有两种方式:函数或者用类来包装线程对象。
_thread的创建多线程示例
这就是函数式来包装线程对象:调用 _thread 模块中的start_new_thread()函数来产生新线程。语法如下:
_thread.start_new_thread ( function, args[, kwargs] )
- function:线程函数
- args:传递线程函数的参数 传参数必须是tuple类型(元组)
- kwagrs:可选参数
import _thread
import time
#为线程定义一个函数
def print_time(threadName,delay):
count= 0
while count < 3:
time.sleep(delay)
count += 1
print("%s:%s" % (threadName,time.ctime(time.time())))
try:
#创建两个线程
_thread.start_new_thread(print_time,("thread-1",1))
_thread.start_new_thread(print_time,("thread-2",2))
except:
print("ERROR!!")
#主程序,因为线程需要挂载到主线程运行,因此没有这一步的话不执行多线程
while 1:
pass
#输出结果:线程1延时取1,线程2延时取2
thread-1:Tue Aug 7 19:52:17 2018
thread-2:Tue Aug 7 19:52:18 2018
thread-1:Tue Aug 7 19:52:19 2018
thread-1:Tue Aug 7 19:52:20 2018
thread-2:Tue Aug 7 19:52:21 2018
thread-2:Tue Aug 7 19:52:23 2018
'''
由于任何进程默认就会启动一个线程,我们把该线程称为主线程,主线程又可以启动新的线程,Python的threading模块有个current_thread()函数,它永远返回当前线程的实例。
主线程实例的名字叫MainThread,子线程的名字在创建时指定,我们用LoopThread命名子线程。
名字仅仅在打印时用来显示,完全没有其他意义,如果不起名字Python就自动给线程命名为Thread-1,Thread-2
'''
线程同步:锁
锁的概念在多线程里应该算是灵魂级重要的东西了吧,多线程和多进程最大的不同在于,多进程中,同一个变量,各自有一份拷贝存在于每个进程中,互不影响,而多线程中,所有变量都由所有线程共享,所以,任何一个变量都可以被任何一个线程修改,因此,线程之间共享数据最大的危险在于多个线程同时改一个变量,把内容给改乱了。
为了解决这些问题,我们需要用到锁:
使用 Thread 对象的 Lock 和 Rlock 可以实现简单的线程同步,这两个对象都有 acquire 方法和 release 方法,对于那些需要每次只允许一个线程操作的数据,可以将其操作放到 acquire 和 release 方法之间。
- 初始化锁:lock=threading.Lock()
- 加锁:lock.acqure()
- 解锁:lock.release()
import threading
import time
x = 0
#初始化锁
lock = threading.Lock()
def change_it(n):
global x
##加锁
lock.acquire()
x = x + n
x = x - n
##解锁,不加这条会导致死锁
lock.release()
def run_thread(n):
for i in range(1000000):
change_it(n)
t1 = threading.Thread(target = run_thread,args=(5,))
t2 = threading.Thread(target = run_thread,args=(8,))
start = time.time()
t1.start()
t2.start()
t1.join()
t2.join()
end = time.time() - start
print(x)
print(end)
#如果不加三条锁的方法会输出:
2
0.9724380970001221
#是因为两个线程在巨多次的循环中发生了错乱
#加锁之后正确输出,虽然时间会长一点但是工作正常
0
2.080798864364624
上面记录完函数包装多线程后,下面就是用类来包装多线程了~
使用threading模块来class实例化创建多线程
threading 模块除了包含 _thread 模块中的所有方法外,还提供的其他方法:
- threading.currentThread(): 返回当前的线程变量。
- threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
- threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。
除了使用方法外,线程模块同样提供了Thread类来处理线程,Thread类提供了以下方法:
- run(): 用以表示线程活动的方法。
- start():启动线程活动。
- join([time]): 等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。
- isAlive(): 返回线程是否活动的。
- getName(): 返回线程名。
- setName(): 设置线程名。
创建的方式就是:从 threading.Thread 继承创建一个新的子类,并实例化后调用 start() 方法启动新线程,即它调用了线程的 run() 方法:
import threading
import time
exitflag = 0
#定义一个线程类
class myThread(threading.Thread):
def __init__(self,threadID,name,counter):
threading.Thread.__init__(self)
self.threadID = threadID
self.name = name
self.counter = counter
def run(self):
print("开始线程:" + self.name)
print_time(self.name,self.counter,5)
print("结束线程:" + self.name)
#定义方法
def print_time(threadName,delay,counter):
while counter:
if exitflag:
threadName.exit()
time.sleep(delay)
print("%s:%s" % (threadName,time.ctime(time.time())))
counter -= 1
#创建一个线程
thread1 = myThread(1,"thread1",1)
thread2 = myThread(1,"thread2",2)
#启动线程
thread1.start()
thread2.start()
thread1.join()
thread2.join()
print("已经全部线程结束了")
#输出
开始线程:thread1
开始线程:thread2
thread1:Tue Aug 7 20:04:14 2018
thread2:Tue Aug 7 20:04:15 2018
thread1:Tue Aug 7 20:04:15 2018
thread1:Tue Aug 7 20:04:16 2018
thread2:Tue Aug 7 20:04:17 2018
thread1:Tue Aug 7 20:04:17 2018
thread1:Tue Aug 7 20:04:18 2018
结束线程:thread1
thread2:Tue Aug 7 20:04:19 2018
thread2:Tue Aug 7 20:04:21 2018
thread2:Tue Aug 7 20:04:23 2018
结束线程:thread2
已经全部线程结束了
threading的线程优先级队列(Queue)
Python 的 Queue 模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列 PriorityQueue。
这些队列都实现了锁原语,能够在多线程中直接使用,可以使用队列来实现线程间的同步。
Queue 模块中的常用方法:
- Queue.qsize() 返回队列的大小
- Queue.empty() 如果队列为空,返回True,反之False
- Queue.full() 如果队列满了,返回True,反之False
- Queue.full 与 maxsize 大小对应
- Queue.get([block[, timeout]])获取队列,timeout等待时间
- Queue.get_nowait() 相当Queue.get(False)
- Queue.put(item) 写入队列,timeout等待时间
- Queue.put_nowait(item) 相当Queue.put(item, False)
- Queue.task_done() 在完成一项工作之后,Queue.task_done()函数向任务已经完成的队列发送一个信号
- Queue.join() 实际上意味着等到队列为空,再执行别的操作
import threading
import time
import queue
exitflag=0
queueLock=threading.Lock()
workQueue=queue.Queue(10)
class myThread(threading.Thread):
def __init__(self,threadID,name,c):
threading.Thread.__init__(self)
self.threadID=threadID
self.name=name
self.c=c
def run(self):
print("开始线程:"+self.name)
process_data(self.name,self.c)
print("退出线程:"+self.name)
def process_data(threadName,c):
while not exitflag:
queueLock.acquire()
if not workQueue.empty():
data=c.get()
queueLock.release()
print("%s processing %s"%(threadName,data))
else:
queueLock.release()
time.sleep(1)
threadID=1
threads=[]
threadlist=["thread-1","thread-2","thread-3"]
namelist=["one","two","three","four","five"]
#创建线程
for tName in threadlist:
thread=myThread(threadID,tName,workQueue)
thread.start()
threads.append(thread)
threadID+=1
#填充我们的队列
queueLock.acquire()
for word in namelist:
workQueue.put(word)
queueLock.release()
#等待队列清空
while not workQueue.empty():
pass
exitflag=1
#等待所有线程完成
for t in threads:
t.join()
print("退出主线程")
#输出
开始线程:thread-1
开始线程:thread-2
开始线程:thread-3
thread-3 processing one
thread-2 processing threethread-1 processing two
thread-3 processing four
thread-2 processing five
退出线程:thread-3
退出线程:thread-2
退出线程:thread-1
退出主线程