函数执行时的名字空间

在Python虚拟机函数机制之无参调用(一)这一章中,我们对Python中的函数调用机制有个大概的了解,在此基础上,我们再来看一些细节上的问题。在执行MAKE_FUNCTION指令时,调用了PyFunction_New方法,这个方法有一个参数是globals,这个globals最终将称为与函数f对应的PyFrameObject中的global名字空间——f_globals

ceval.c

case MAKE_FUNCTION:
	v = POP(); /* code object */
	x = PyFunction_New(v, f->f_globals);
	Py_DECREF(v);
	/* XXX Maybe this should be a separate opcode? */
	if (x != NULL && oparg > 0) {
		v = PyTuple_New(oparg);
		if (v == NULL) {
			Py_DECREF(x);
			x = NULL;
			break;
		}
		while (--oparg >= 0) {
			w = POP();
			PyTuple_SET_ITEM(v, oparg, w);
		}
		err = PyFunction_SetDefaults(x, v);
		Py_DECREF(v);
	}
	PUSH(x);
	break;
# cat demo.py
def f():
    print("Function")
 
 
f()
 
# python2.5
……
>>> source = open("demo.py").read()
>>> co = compile(source, "demo.py", "exec")
>>> import dis
>>> dis.dis(co)
  1           0 LOAD_CONST               0 (<code object f at 0x7fd9831c3648, file "demo.py", line 1>)
              3 MAKE_FUNCTION            0
              6 STORE_NAME               0 (f)
 
  5           9 LOAD_NAME                0 (f)
             12 CALL_FUNCTION            0
             15 POP_TOP            
             16 LOAD_CONST               1 (None)
             19 RETURN_VALUE       
>>> from demo import f
Function
>>> dis.dis(f)
  2           0 LOAD_CONST               1 ('Function')
              3 PRINT_ITEM         
              4 PRINT_NEWLINE      
              5 LOAD_CONST               0 (None)
              8 RETURN_VALUE

  在Python虚拟机中的一般表达式(三)中,我们介绍了LOAD_NAME这条指令,这条指令在执行时会依次从三个PyDictObject对象进行搜索,搜索顺序是:f_locals、f_globals、f_builtins。在PyFunction_New时传入的globals将成为在新的栈帧中执行函数的global名字空间。在MAKE_FUNCTION中,我们看到传入的globals参数为当前PyFrameObject对象中的f_globals。这意味着,在执行demo.py的字节码指令时的global名字空间,与执行函数f的字节码序列时的global名字空间实际上是同一个名字空间,这个名字空间通过PyFunctionObject的携带,和字节码指令对应的PyCodeObject对象一起被传入到新的栈帧中

下面,让我们修改MAKE_FUNCTION指令和call_function的实现,将global名字空间的地址和内容输出

ceval.c

case MAKE_FUNCTION:
	v = POP(); /* code object */
	char *v_co_name = PyString_AsString(((PyCodeObject *)v)->co_name);
	if(strcmp(v_co_name, "f") == 0)
	{
		if (stream == NULL || stream == Py_None)
		{
			w = PySys_GetObject("stdout");
			if (w == NULL)
			{
				PyErr_SetString(PyExc_RuntimeError,
								"lost sys.stdout");
				err = -1;
			}
			
		}
		//打印globals名字空间的地址
		printf("[MAKE_FUNCTION]:f_globals addr:%p\n", f->f_globals);
		//打印globals名字空间的内容
		printf("[MAKE_FUNCTION]:");
		PyFile_WriteObject(f->f_globals, w, Py_PRINT_RAW);
		printf("\n");
		stream = NULL;
	}
	x = PyFunction_New(v, f->f_globals);
	……
	
	
……
static PyObject * call_function(PyObject ***pp_stack, int oparg)
{
	int na = oparg & 0xff;
	int nk = (oparg>>8) & 0xff;
	int n = na + 2 * nk;
	PyObject **pfunc = (*pp_stack) - n - 1;
	PyObject *func = *pfunc;
	PyObject *x, *w;

	char *func_name = PyEval_GetFuncName(func);
	if (strcmp(func_name, "f") == 0)
	{
		PyObject *std = PySys_GetObject("stdout");
		//获取函数所对应的global名字空间
		PyObject *func_globals = (PyCodeObject *)PyFunction_GET_GLOBALS(func);
		//打印globals名字空间的地址
		printf("[call_function]:func_globals addr:%p\n", func_globals);
		//打印globals名字空间的内容
		printf("[call_function]:");
		PyFile_WriteObject(func_globals, std, Py_PRINT_RAW);
		printf("\n");
	}
	
	……
}

  然后,我们执行一下demo1.py这个文件

# cat demo1.py 
a = 1
b = 3


def f():
    print("Function f")


def g():
    print("Function g")


f()

# python2.5 demo1.py 
[MAKE_FUNCTION]:f_globals addr:0x2237740
[MAKE_FUNCTION]:{'a': 1, 'b': 3, '__builtins__': <module '__builtin__' (built-in)>, '__file__': 'demo1.py', '__name__': '__main__', '__doc__': None}
[call_function]:func_globals addr:0x2237740
[call_function]:{'a': 1, 'b': 3, 'g': <function g at 0x7f54708c7de8>, 'f': <function f at 0x7f54708c7b18>, '__builtins__': <module '__builtin__' (built-in)>, '__file__': 'demo1.py', '__name__': '__main__', '__doc__': None}
Function f

  可以看到,MAKE_FUNCTION中和call_function中的global名字空间的地址是一样的,demo1.py中所定义的符号都包含在global名字空间中,使得函数f可以使用a、b两个变量,正是依赖于global名字空间的传递,才使得函数f可以使用函数f以外的符号。现在,让我们分别看下[MAKE_FUNCTION]和[call_function]中的globals内容,我们会发现,前者没有函数f和g,后者有函数f和g,加上两者的地址是相同的。这说明在字节码指令执行的时候,一定会把函数f和g放入到global名字空间,否则,函数在global中找不到自身的定义,无法实现递归,虽然我们的函数f在这里并没有递归

那么,函数f和g是在何时偷偷溜进global名字空间呢?我们用dis模块来查看一下demo1.py源代码对应的字节码指令

[root@10-19-127-65 python]# python2.5
……
>>> source = open("demo1.py").read()
>>> co = compile(source, "demo1.py", "exec")
>>> import dis
>>> dis.dis(co)
  1           0 LOAD_CONST               0 (1)
              3 STORE_NAME               0 (a)

  2           6 LOAD_CONST               1 (3)
              9 STORE_NAME               1 (b)

  5          12 LOAD_CONST               2 (<code object f at 0x7f5d0aa74648, file "demo1.py", line 5>)
             15 MAKE_FUNCTION            0
             18 STORE_NAME               2 (f)

  9          21 LOAD_CONST               3 (<code object g at 0x7f5d0aa74918, file "demo1.py", line 9>)
             24 MAKE_FUNCTION            0
             27 STORE_NAME               3 (g)

 13          30 LOAD_NAME                2 (f)
             33 CALL_FUNCTION            0
             36 POP_TOP             
             37 LOAD_CONST               4 (None)
             40 RETURN_VALUE

  我们看到"15   MAKE_FUNCTION   0"和"24   MAKE_FUNCTION   0"这两句指令,这两句都是执行def语句创建PyFunctionObject对象,MAKE_FUNCTION指令创建PyFunctionObject对象后便将其压入栈,显然,在global名字空间建立符号f和g与PyFunctionObject对象的映射不在MAKE_FUNCTION。所以我们往后找,这两句指令的后面又分别跟着"18   STORE_NAME   2 (f)"和"27   STORE_NAME   3 (g)",会不会是在这里建立符号与函数对象的映射呢?我们看看STORE_NAME的实现:

ceval.c

case STORE_NAME:
	w = GETITEM(names, oparg);
	v = POP();
	if ((x = f->f_locals) != NULL)
	{
		if (PyDict_CheckExact(x))
			err = PyDict_SetItem(x, w, v);
		else
			err = PyObject_SetItem(x, w, v);
		Py_DECREF(v);
		if (err == 0)
			continue;
		break;
	}
	PyErr_Format(PyExc_SystemError,
				 "no locals found when storing %s",
				 PyObject_REPR(w));
	break;

  这里我们看到,STORE_NAME会对local名字空间做符号和其值的映射,但并不是我们之前所说的global名字空间啊!所以,到底是不是在这里做符号与函数的映射呢?答案是:符号与函数的映射,正是在STORE_NAME完成的。这里也暴露一个信息,demo1.py执行时对应的local名字空间和global名字空间实际上是一个对象,想想也是这个道理,因为函数的local名字空间存储的是函数内的局部变量,global存储的是函数之外的变量,那么一个脚本本身所对应的local名字空间存储的是脚本本身的变量,那么global名字空间呢?这里没得选,只能和脚本本身的local名字空间共同使用一个PyDictObject对象了