backtrace函数是callstack调试器的基本功能之一,利用此功能,可以看到各级函数的调用关系。在gdb中,这一功能被称为backtrace,输入bt命令就可以看到当前函数的callstack。它的实现多少有些有趣,这里研究一下。

我们先看看栈的基本模型


参数N

↓高地址

参数…

函数参数入栈的顺序与具体的调用方式有关

参数 3

参数 2

参数 1

eip

返回本次调用后,下一条指令的地址

ebp

这里保存调用者的ebp,然后ebp寄存器会指向此时的栈顶。

临时变量1

 

临时变量2

 

临时变量3

 

临时变量…

 

临时变量n

↓低地址


栈一直随着函数调用的深入,一直向栈顶方向压下去。每次调用函数时候,先压函数参数(从右往左顺序压),再压入函数调用下条指令的地址(由call完成)。接着进入调用函数体中先执行"pushl %ebp"和"movl %esp, %ebp"(一般已经由编译器加入到函数头中了),接着就是把函数体中的局部变量压入栈中。再遇到函数的调用的嵌套则依此类推。

"pushl %ebp"和"movl %esp, %ebp"这两条指令实在大有深意:首先将EBP入栈,然后将栈顶指针ESP赋值给EBP。"movl %esp, %ebp"这条指令表面上看是用esp把ebp原来的值覆盖了,其实不然——因为给ebp赋值之前,原ebp值已被压栈(位于栈顶),而新的ebp又恰恰指向栈顶。
此时ebp寄存器就已处于一个很重要的地位,该寄存器中存储着栈中的一个地址(原ebp入栈后的栈顶),从该地址为基准,向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值,而该地址处又存储着上一层函数调用时的ebp值!

要实现callstack我们需要知道以下信息:

1.调用函数时的指令地址(即当时的eip,也就是上一个(int *)ebp+1的位置存放的内容)。

2.指令地址对应的源代码代码位置。

关于第一点,从上表中,可以看出,栈中存有各级eip的值,我们取出来就行了。用下面的代码可以实现:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define LEN 4
#define EXEFILE "bt"

int backtrace_m(void **buffer, int size)
{
       int i = 0;
       unsigned int _ebp = 0;
       unsigned int _eip = 0;
       char cmd[size][64];
       __asm__ __volatile__(" \
              movl %%ebp, %0"
              :"=g" (_ebp)
              :
              :"memory"
       );

       for(i = 0; i < size; i++)
       {
              _eip = (unsigned int)((unsigned int*)_ebp + 1);
              _eip = *(unsigned int*)_eip;
              _ebp = *(unsigned int*)_ebp;
              buffer[i] = (void*)_eip;

              fprintf(stderr, "%p -> ", buffer[i]);
              memset(cmd[i], 0, sizeof(cmd[i]));
              sprintf(cmd[i], "addr2line %p -e ", buffer[i]);
              strncat(cmd[i], EXEFILE, strlen(EXEFILE));
              system(cmd[i]);
       }

       return size;
}

static void test2(void)
{
       int i = 0;
       void *buffer[LEN] = {0};
       backtrace_m(buffer, LEN);
       return;
}

static void test1(void)
{
       test2();
}

static void test(void)
{
       test1();
}

int main(int argc, char *argv[])
{
       test();
       return 0;
}



gcc 4.4.0, Ubuntu 9.04编译通过

程序输出:

0x80486b2 -> /home/steven/ctest/bt.c:44

0x80486bf -> /home/steven/ctest/bt.c:49

0x80486cc -> /home/steven/ctest/bt.c:54

0x80486d9 -> /home/steven/ctest/bt.c:59 

关于如何把指令地址与行号对应起来,这也很简单。可以从map文件或者ELF中查询。Binutil带有一个addr2line的小工具,可以帮助查出地址在源文件中对应的代码位置,前提是编译的时候需要加上-ggdb的编译选项。

[root@linux bt]# addr2line  0x804849c -e bt

/root/test/bt/bt.c:42