Process([group [, target [, name [, args [, kwargs]]]]])
group: 线程组,目前还没有实现,库引用中提示必须是None;
target: 要执行的方法;
name: 进程名;
args/kwargs: 要传入方法的参数。
实例方法:
is_alive():返回进程是否在运行。
join([timeout]):阻塞当前上下文环境的进程程,直到调用此方法的进程终止或到达指定的timeout(可选参数)。
start():进程准备就绪,等待CPU调度
run():strat()调用run方法,如果实例进程时未制定传入target,这star执行t默认run()方法。
terminate():不管任务是否完成,立即停止工作进程
属性:
daemon:和线程的setDeamon功能一样
name:进程名字。
pid:进程号。
import multiprocessing
class MyProcess(multiprocessing.Process):
def __init__(self):
super().__init__()
def run(self):
print('{} say ok'.format(self.name))
if __name__ == '__main__':
p=MyProcess()
p.start()
=================================================================
进程队列Queue
# import multiprocessing
#
# def foo(q):
# q.put('ds')
#
#
# q = multiprocessing.Queue()
# if __name__ == '__main__':
#
# p=multiprocessing.Process(target=foo,args=(q,))
# p.start()
# print(q.get())
=================================================================
Pipe()
Pipe的本质是进程之间的数据传递,而不是数据共享,这和socket有点像。pipe()返回两个连接对象分别表示管道的两端,每端都有send()和recv()方法。如果两个进程试图在同一时间的同一端进行读取和写入那么,这可能会损坏管道中的数据。
# from multiprocessing import Pipe,Process
#
# def foo(conn):
# conn.send('dw')
# print(conn.recv())
#
#
# if __name__ == '__main__':
# sock, conn = Pipe()
# q=Process(target=foo,args=(conn,))
# q.start()
#
# print(sock.recv())
# sock.send('dd')
=================================================================
Manager
Queue和pipe只是实现了数据交互,并没实现数据共享,即一个进程去更改另一个进程的数据。
通过Manager可实现进程间数据的共享。Manager()返回的manager对象会通过一个服务进程,来使其他进程通过代理的方式操作python对象。manager对象支持 list, dict, Namespace, Lock, RLock, Semaphore, BoundedSemaphore, Condition, Event, Barrier, Queue, Value ,Array.
# from multiprocessing import Manager,Process
#
# def foo(d,x,y):
# d[x]=y
# if __name__ == '__main__':
# manager=Manager()
# Mdict=manager.dict({'kill':9572})
# l=[]
# for i in range(5):
# p=Process(target=foo,args=(Mdict,'dog{}'.format(i),i))
# p.start()
# l.append(p)
# for j in l :
# j.join()
#
# print(Mdict)
=================================================================
进程池
由于进程启动的开销比较大,使用多进程的时候会导致大量内存空间被消耗。为了防止这种情况发生可以使用进程池,(由于启动线程的开销比较小,所以不需要线程池这种概念,多线程只会频繁得切换cpu导致系统变慢,并不会占用过多的内存空间)
进程池中常用方法:
apply() 同步执行(串行)
apply_async() 异步执行(并行)
terminate() 立刻关闭进程池
close() 等待所有进程结束后,才关闭进程池。
join() 主进程等待所有子进程执行完毕。必须在close或terminate()之后。
# from multiprocessing import Pool
# import time
#
# def foo(n):
# print(n)
# time.sleep(1)
# if __name__ == '__main__':
# pool_obj=Pool(5)#进程池内有5个进程
#
# for i in range(100):#开100任务
# p=pool_obj.apply_async(func=foo,args=(i,))
#
# print(p,type(p))
# print(pool_obj,type(pool_obj))
# pool_obj.close()
# pool_obj.join()
=================================================================
协程
协程,又称微线程,纤程。英文名Coroutine。一句话说明什么是线程:协程是一种用户态的轻量级线程。
协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置。
yield实现协程
# import time
#
# def consumer():
# r = ''
# while True:
# n = yield r
# print('消费%s'%n)
# time.sleep(1)
# r='200 ok'
#
# def produce(c):
# next(c)
# n = 0
# while n<5:
# n+=1
# print('生产%s'%n)
# cr = c.send(n)
#
# print('消费反馈%s'%cr)
# c.close()
#
# if __name__ == '__main__':
# c=consumer()
# produce(c)
-------------------------------------------------------------------------------------------------------------------
greenlet模块
greenlet机制的主要思想是:生成器函数或者协程函数中的yield语句挂起函数的执行,直到稍后使用next()或send()操作进行恢复为止。可以使用一个调度器循环在一组生成器函数之间协作多个任务。greentlet是python中实现我们所谓的"Coroutine(协程)"的一个基础库.
import greenlet
def foo():
print(1)
b.switch()
print(3)
b.switch()
def bar():
print(2)
f.switch()
print(4)
f=greenlet.greenlet(foo)
b=greenlet.greenlet(bar)
f.switch()
-------------------------------------------------------------------------------------------------------------------
Python通过yield提供了对协程的基本支持,但是不完全。而第三方的gevent为Python提供了比较完善的协程支持。
gevent是第三方库,通过greenlet实现协程,其基本思想是:
当一个greenlet遇到IO操作时,比如访问网络,就自动切换到其他的greenlet,等到IO操作完成,再在适当的时候切换回来继续执行。由于IO操作非常耗时,经常使程序处于等待状态,有了gevent为我们自动切换协程,就保证总有greenlet在运行,而不是等待IO。
由于切换是在IO操作时自动完成,所以gevent需要修改Python自带的一些标准库,这一过程在启动时通过monkey patch完成。
# import re,requests,time,gevent
# def foo(url):
#
# response=requests.get(url)
# response_str=response.text
# return response_str
#
# def bar(url):
# res=foo(url)
# obj=re.compile('<img src="(.*?)" width="251" height="360" title=".*?" alt=".*?">',re.S)
# lis = obj.findall(res)
# print(lis)
# if __name__ == '__main__':
# s=time.time()
# gevent.joinall([gevent.spawn(bar,'http://www.youwu.cc/tag/boluoshe/list_1.html'),
# gevent.spawn(bar, 'http://www.youwu.cc/tag/boluoshe/list_2.html'),
# gevent.spawn(bar, 'http://www.youwu.cc/tag/boluoshe/list_3.html'),
# gevent.spawn(bar, 'http://www.youwu.cc/tag/boluoshe/list_4.html'),
# gevent.spawn(bar, 'http://www.youwu.cc/tag/boluoshe/list_5.html')])
# print(time.time()-s)