网络上有很多讨论C++ 的“引用”与“指针“的区别的文章,谈到区别,其中有一条:“引用不能为空(NULL),引用必须与合法的存储单元关联,指针则可以是NULL)”,但在实际应用中,有时候为了保持一致性,我们会抛开这个规则,人为创造出一个“空引用”。

很多情况下,“空引用”确实可以工作,以致于“引用不能为空”的忠告,被嘲笑为形式主义,仅仅是标准制定者的耸人听闻。一个“空引用”的例子是:

int * a = NULL;
int & b = *a;

于是当访问b的时候,程序异常出现了:

void f(int & p)
{
    p = 0;
}
f(b);

当然,可以增加点判断,修正这个问题:

void f(int & p)
{
    if (&p) p = 0;
}

怎么样,是不是有点别扭?但是如果换成成指针,你要输入的字符数是一模一样的:

void f(int * p)
{
    if (p) *p = 0;
}

 于是,到底是使用“引用”还是“指针”,好像就是智者见智仁者见仁的事情了。

 

然而,然而。。。。。。

 

这真的一样吗?

 

我们来看看复杂一点的例子:

// test.cpp

#include <iostream>

class A
{
    int a;
};

class B
{
    int b;
};

class C
: public A, public B
{
    int c;
};

void fb(B & b)
{
    std::cout << &b << std::endl;
}

void fb(B * b)
{
    std::cout << b << std::endl;
}

int main(int argc, char* argv[])
{
    C * c = NULL;

    fb(c);

    fb(*c);

    return 0;
}

编译运行一下看看:

$ ./test
0
0x4

咦,怎么&b不是0,也就是不是“空引用”了,这时候,即使加上判断,if (&b),也无济于事了。

大家也许注意到了,上面是linux环境运行,那么windows环境呢:

>test.exe
00000000
00000000

这时候,“空引用”保持了他的“空”属性,仅在windows平台做C++的开发者,可以松口气了。

这是怎么回事呢,是你的眼睛欺骗了你?也许是,但是CPU不会欺骗我们,从汇编代码可以看出本质。下面是linux平台编译的代码:

Dump of assembler code for function main:
0x0804870a <+0>: push %ebp
0x0804870b <+1>: mov %esp,%ebp
0x0804870d <+3>: and $0xfffffff0,%esp
0x08048710 <+6>: sub $0x20,%esp
0x08048713 <+9>: movl $0x0,0x1c(%esp)
0x0804871b <+17>: cmpl $0x0,0x1c(%esp)
0x08048720 <+22>: je 0x804872b <main+33>
0x08048722 <+24>: mov 0x1c(%esp),%eax
0x08048726 <+28>: add $0x4,%eax
0x08048729 <+31>: jmp 0x8048730 <main+38>
0x0804872b <+33>: mov $0x0,%eax
0x08048730 <+38>: mov %eax,(%esp)
0x08048733 <+41>: call 0x80486df <fb(B*)>
0x08048738 <+46>: mov 0x1c(%esp),%eax
0x0804873c <+50>: add $0x4,%eax
0x0804873f <+53>: mov %eax,(%esp)
0x08048742 <+56>: call 0x80486b4 <fb(B&)>
0x08048747 <+61>: mov $0x0,%eax
0x0804874c <+66>: leave 
0x0804874d <+67>: ret

这是windows平台的:

wmain:
004114D0 push ebp 
004114D1 mov ebp,esp 
004114D3 sub esp,0DCh 
004114D9 push ebx 
004114DA push esi 
004114DB push edi 
004114DC lea edi,[ebp-0DCh] 
004114E2 mov ecx,37h 
004114E7 mov eax,0CCCCCCCCh 
004114EC rep stos dword ptr es:[edi] 
004114EE mov dword ptr [c],0 
004114F5 mov eax,dword ptr [c] 
004114F8 mov dword ptr [rc],eax 
004114FB cmp dword ptr [c],0 
004114FF je wmain+3Fh (41150Fh) 
00411501 mov eax,dword ptr [c] 
00411504 add eax,4 
00411507 mov dword ptr [ebp-0DCh],eax 
0041150D jmp wmain+49h (411519h) 
0041150F mov dword ptr [ebp-0DCh],0 
00411519 mov ecx,dword ptr [ebp-0DCh] 
0041151F push ecx 
00411520 call fb (411118h) 
00411525 add esp,4 
00411528 cmp dword ptr [rc],0 
0041152C je wmain+6Ch (41153Ch) 
0041152E mov eax,dword ptr [rc] 
00411531 add eax,4 
00411534 mov dword ptr [ebp-0DCh],eax 
0041153A jmp wmain+76h (411546h) 
0041153C mov dword ptr [ebp-0DCh],0 
00411546 mov ecx,dword ptr [ebp-0DCh] 
0041154C push ecx 
0041154D call fb (41108Ch) 
00411552 add esp,4 
00411555 xor eax,eax 
00411557 pop edi 
00411558 pop esi 
00411559 pop ebx 
0041155A add esp,0DCh 
00411560 cmp ebp,esp 
00411562 call @ILT+345(__RTC_CheckEsp) (41115Eh) 
00411567 mov esp,ebp 
00411569 pop ebp 
0041156A ret

汇编代码有兴趣自己研究,不细说了。

回过头想想,两个平台的编译器的两种处理方式,都有他的合理性,windows平台增加了容错性,而linux平台在处理引用时减少判断,增加性能。这隐隐体现出windows与linux开发理念的不同。

最后,请大家记住,引用不能为空,如果可能存在空对象时,请使用指针。