一、PyPy介绍

PyPy是用Python实现的Python解释器的动态编译器,是Armin Rigo开发的产品,能够提升我们python项目的运行速度。PyPy 是利用即时编译的 Python 的替代实现。背后的原理是 PyPy 开始时就像一个解释器,直接从源文件运行我们的 Python 代码。但是,PyPy 不是逐行运行代码,而是在执行它们之前将部分代码编译为机器代码。


根据官方文档的介绍可以看到,平均下来PyPy比CPython(也就是我们主流使用的python)快4.5倍:

python pip配置加速 pypy加速_python pip配置加速


PyPy除了速度快外,还有下面一些特点:

  1. 内存使用情况比cpython少
  2. gc策略更优化
  3. Stackless 协程模式默认支持,支持高并发
  4. 兼容性好,高度兼容cpython实现,基本可以无缝切换
  5. PyPy为许多平台和操作系统提供预编译的二进制文件:

python pip配置加速 pypy加速_性能瓶颈_02


二、PyPy安装

我们直接访问下载地址:https://www.pypy.org/download.html 下载对应的包使用即可。

下载完成后解压到任意目录然后加入到环境变量中:

python pip配置加速 pypy加速_开发语言_03


然后在控制台中执行pypy就可以开始使用它了:

python pip配置加速 pypy加速_python_04


三、PyPy和Python测试对比

我们可以通过一个简单的脚本来测试一下它们之间的性能差异,下面是一个循环3千万次的累乘计算:

import datetime

x = 0
start_time = datetime.datetime.now()
for i in range(30000000):
    x += i * i

print('耗时:', datetime.datetime.now() - start_time)

测试结果

python耗时: 0:00:03.357052
pypy耗时: 0:00:00.761932

可以看到有近4.5倍的性能差距,这也符合PyPy官网介绍的。


四、PyPy注意事项

经过测试PyPy也有一些库是不支持的:

  1. pyinstrument
  2. sshtunnel

这只是我经常使用的一些库中发现不支持的库,但绝大部分的库都是支持的,比如Django、requests、pymysql 等。


另外,对于诸如numpypandas这类本身就是C语言开发的扩展时,PyPy的性能反而会更低,PyPy只对纯Python库有明显的性能提升。


最后在你决定要使用PyPy时,你应该思考你的项目是否有性能瓶颈,或者性能瓶颈是因为Python本身效率慢的问题。如果是后端接口项目(类似使用flask、django开发的后端)其性能瓶颈往往在SQL的执行和代码本身的逻辑问题上,而不是python执行慢导致的。所以即便你使用了PyPy也大概率不能解决你的性能问题。