之前一直在说Python是一门解释型语言?

没学Python前,一直以为Python是一门解释型语言,当学习是,发现了*.pyc文件的存在,才知道哪是一厢情愿了。如果Python是解释型语言,那么生成*.pyc文件是什么呢?C应该是compiled的缩写才对啊!

Python生成pyc文件

.pyc是一种二进制文件,是由py文件经过编译后,生成的文件,是一种字节码文件(byte code)。pyc文件经过python解释器最终会生成机器码运行。所以pyc文件是可以跨平台部署的,类似Java的.class文件。一般py文件改变后,都会重新生成pyc文件。

为什么要手动提前生成pyc文件

主要是不想把源代码暴露出来。

下面看看一些基础概念。

解释型语言和编译型语言

计算机是不能够识别高级语言的,所以当我们运行一个高级语言程序的时候,就需要一个“翻译机”来从事把高级语言转变成计算机能读懂的机器语言的过程。这个过程分成两类,第一种是编译,第二种是解释。

编译型语言在程序执行之前,先会通过编译器对程序执行一个编译的过程,把程序转变成机器语言。运行时就不需要翻译,而直接执行就可以了。

最典型的编译型语言就是C语言。

解释型语言就没有这个编译的过程,而是在程序运行的时候,通过解释器对程序逐行做出解释,然后直接运行,

最典型的解释型语言是Ruby。

通过以上的例子,我们可以来总结一下解释型语言和编译型语言的优缺点,因为编译型语言在程序运行之前就已经对程序做出来“翻译”,所以在运行时就少掉了“翻译‘的过程,所以效率比较高。但是我们也不能一概而论,一些解释型语言也可以通过解释器的优化来在对程序做出翻译时对整个程序做出优化,从而在效率上超过编译型语言。

此外,随着Java等基于虚拟机的语言的兴起,我们又不能把语言纯粹地分成解释型和编译型这两种。

用Java来举例,Java首先是通过编译器编译成字节码文件,然后在运行时通过解释器个解释成机器文件。

Java是一种先编译后解释的语言。

Python到底是什么?

Python和Java/C#一样,也是一门基于虚拟机的语言,我们先来从表面上简单地了解一下Python程序的运行过程吧。

当我们在命令行中输入Python hello.py时,其实是激活了Python的”解释器“:你要开始工作了。开始在”解释“之前,其实执行的第一项工作和Java一样,是编译。

熟悉Java的可以想一下我们在命令行中如何执行一个Java的程序:

javac hell.java

java hello

只是我们在用eclipse之类的IDE时,将这两部分给融合成了一部分而已。其实Python也一样,当我们执行Python hello.py时,他也一样执行了这么一个过程,所以我们应该这样来描述Python,Python是一门先编译后解释的语言。

简述Python的运行过程

在说这个问题之前,我们先来说两个概念,PyCodeObject和pyc文件。

我们在硬盘上看到的pyc自然不必多说,而其实PyCodeObject中,当Python程序运行结束时,Python解释器则将PyCodeObject写回到pyc文件中。

当Python程序第二次运行时,首先程序会在硬盘中寻找到pyc文件,如果找到,则直接载入,否则就重复上面的过程。

所以我们应该这样来定位PyCodeObject和pyc文件,

pyc文件其实是PyCodeObject的一种持久化保存方式。

经过编译后生成pyc的好处就是:

是因为在运行python程序时,Python解释器已经把编译的字节码放在__pycache__文件夹中,这样以后再次运行的话,如果被调用的模块未发生改变,那就直接跳过编译这一步,直接到__pycache__文件夹中运行相关的 *.pyc 文件,这样就大大缩短了项目运行前的准备时间。