前言:
上vip课的时候每次讲到框架的执行,就会有好学的同学问用多线程怎么执行,然后我每次都会说在测开课程会详细讲解,这并不是套路,因为如果你不理解多线程,不清楚什么时候该用什么时候不该用,就会适得其反。今天我们就来聊一聊多线程这个烫手的山芋。
一、python执行慢的原因
1、动态类型语言,边解释边执行。
2、GIL锁无法使用多核CPU并发执行。
二、什么是GIL锁
1、全局解释器锁(Global Interpreter Lock),是计算机程序设计语言计时器用于同步线程的一种机制,它使得任何时刻仅有一个线程在执行。
即使在多核CPU上,使用GIL的解释器也只允许同一时间执行一个线程。
2、你可以理解为这是python设计上的一个Bug,但是因为重构成本太高,龟叔也没打算修复了。
3、那么多线程就没有用了吗?当然不是,多线程可以用于IO密集型任务。
三、CPU密集型
阿里云开发者社区的解释:CPU密集型(CPU-bound) CPU密集型也叫计算密集型,指的是系统的硬盘、内存性能相对CPU要好很多,此时,系统运作大部分的状况是CPU Loading 100%,CPU要读/写I/O(硬盘/内存),I/O在很短的时间就可以完成,而CPU还有许多运算要处理,CPU Loading很高。
说人话:做某件事情的时候CPU很忙,磁盘/内存读取很闲,这个事情就叫CPU密集型任务。
四、IO密集型
阿里云开发者社区的解释:IO密集型指的是系统的CPU性能相对硬盘、内存要好很多,此时,系统运作,大部分的状况是CPU在等I/O (硬盘/内存) 的读/写操作,此时CPU Loading并不高。
说人话:做某件事情的时候磁盘/内存读取很忙,CPU很闲,这个事情就叫IO密集型任务。
五、什么是多线程
百度百科的解释:多线程(multithreading),是指从软件或者硬件上实现多个线程并发执行的技术。
六、多线程使用场景
1、用于IO密集型任务
七、进入主题上代码
import requests
import time
import threading
#干活函数,请求测试派,其他的啥都不干
def get_url(url):
requests.get(url=url)
#单线程实现,访问测试派50次
def single(url):
for i in range(50):
get_url(url)
#多线程实现,访问测试派50次
def create_multi(url):
threads = []
for i in range(50):
#创建子线程
th = threading.Thread(target=get_url,args=(url,))
threads.append(th)
#启动子线程
for val in threads:
val.start()
#主线程等待子线程执行结束再结束
for val in threads:
val.join()
if __name__ == '__main__':
url = "http://testingpai.com/recent"
#单线程执行时间统计
start = time.time()
single(url)
end=time.time()
print("单线程耗时:",end - start)
print("="*30)
#多线程执行时间统计
start = time.time()
create_multi(url)
end=time.time()
print("多线程耗时:",end - start)
输出:
单线程耗时:27.86112666130066
==============================
多线程耗时: 19.54499316215515
►►► 多线程的创建方式
上面我们讲了多线程的使用场景,通过一个简单的例子了解了多线程在IO密集型任务中确实能提高代码执行效率,接下来我们聊一聊多线程的创建。
一、实例化Thread类创建
import requests
import threading
#干活函数,请求测试派,其他的啥都不干
def get_url(url):
requests.get(url=url)
if __name__ == '__main__':
url = "http://testingpai.com/recent"
threads = []
for i in range(50):
#创建子线程
th = threading.Thread(target=get_url,args=(url,))
threads.append(th)
#启动子线程
for val in threads:
val.start()
#主线程等待子线程执行结束再结束
for val in threads:
val.join()
二、继承Thread重写run方法创建
import requests
import threading
class TestThreading(threading.Thread):
def __init__(self):
#调用父类初始化函数进行必要的初始化
super().__init__()
#重写run方法
def run(self):
thread_name = threading.current_thread().name
thread_id = threading.current_thread().ident
print('子线程id={},子线程名称={}:'.format(thread_id, thread_name))
print("干活的函数逻辑写在这里")
res = requests.get(url="http://testingpai.com/recent")
print(res)
if __name__ == '__main__':
#启动子线程
for i in range(3):
th = TestThreading()
th.start()