已有各种工具可以帮助我们调试内核,比如UML、kgdb、qemu等,但比较麻烦的是gdb经常给我一个“value optimized out”的提示,而且执行的路径与gdb的显示也不对应,最近我在利用UML调试ext3文件系统的逻辑时就为此而感到非常麻烦(2.6.30.8的内核):
1
2
3
4
5
|
Breakpoint 1, journal_invalidatepage (journal=0x6c4bd800, page=0x61918b28, offset=0) at fs/jbd/transaction.c:2036
2036 {
(gdb) p bh
$2 = <value optimized out>
(gdb)
|
这应该是因为Linux内核打开gcc的-O2选项优化导致,于是我尝试修改内核Makefile文件(/usr/src/uml/linux-2.6.30.8/Makefile):
将
1
2
3
4
5
|
ifdef CONFIG_CC_OPTIMIZE_FOR_SIZE
KBUILD_CFLAGS += -Os
else
KBUILD_CFLAGS += -O2
endif
|
改为这样(CONFIG_CC_OPTIMIZE_FOR_SIZE可以通过内核选项:General setup —> [ ] Optimize for size,进行开启/关闭,这里不管该选项而也就统一改了):
1
2
3
4
5
|
ifdef CONFIG_CC_OPTIMIZE_FOR_SIZE
KBUILD_CFLAGS += -O0
else
KBUILD_CFLAGS += -O0
endif
|
执行编译,gcc给了我一个华丽的错误:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
[root@lenky linux-2.6.30.8]# make ARCH=um -B V=1
...
mm/built-in.o: In function `index_of':
/usr/src/uml/linux-2.6.30.8/mm/slab.c:341: undefined reference to `__bad_size'
/usr/src/uml/linux-2.6.30.8/mm/slab.c:341: undefined reference to `__bad_size'
/usr/src/uml/linux-2.6.30.8/mm/slab.c:341: undefined reference to `__bad_size'
/usr/src/uml/linux-2.6.30.8/mm/slab.c:341: undefined reference to `__bad_size'
/usr/src/uml/linux-2.6.30.8/mm/slab.c:341: undefined reference to `__bad_size'
mm/built-in.o:/usr/src/uml/linux-2.6.30.8/mm/slab.c:341: more undefined references to `__bad_size' follow
collect2: ld returned 1 exit status
KSYM .tmp_kallsyms1.S
nm: '.tmp_vmlinux1' : No such file
No valid symbol.
make: *** [.tmp_kallsyms1.S] Error 1
|
根据上面的提示信息,我尝试把文件slab.c的编译选项调为-O2,即编辑mm/Makefile文件,在最后加上如下一行:
1
2
3
4
5
6
7
|
[root@lenky linux-2.6.30.8]# vi mm/Makefile
[root@lenky linux-2.6.30.8]# tail -n 5 mm/Makefile
endif
obj-$(CONFIG_QUICKLIST) += quicklist.o
obj-$(CONFIG_CGROUP_MEM_RES_CTLR) += memcontrol.o page_cgroup.o
CFLAGS_slab.o = -O2
|
格式是:
CFLAGS_对应源文件[要去除通常意义上扩展名].o = gcc选项
所以上面加的是:
CFLAGS_slab.o = -O2
重新编译:
1
|
[root@lenky linux-2.6.30.8]# make ARCH=um -B V=1
|
选项-B:以强制所有内核源文件全部重新编译(因为我前面编译过一次了,为了保险起见,就让目标文件全部重新生成吧)
选项V=1:显示详细的编译信息,而不再是简单的“CC init/main.o”。
编译出来的可执行程序linux比-O2的情况还小几M,一启动UML没多久,果然奔溃。
看来内核里有大量的底层代码在书写时只兼容了-O2选项,所以如果以-O0的形式强制编译会导致出错,这即便不在编译时报错,也有极大可能会在实际执行时候出错,完全关闭所有内核源文件的-O2编译选项的风险太大。
退而求次,我是为了调试journal_invalidatepage()函数,那么可以仅把对应源文件transaction.c的优化选项关闭即可,这个源文件的实现在比较高的层次,关闭优化选项应该不会出错。
编辑文件fs/jbd/Makefile,再其最后加上一行:
CFLAGS_transaction.o = -O0
重新编译(之前的其它改动需回滚)后启动UML,一切OK。
试试最开始的示例,用gdb绑定到UML主进程,调试函数journal_invalidatepage(),打印变量bh:
1
2
3
4
5
6
7
8
9
|
Breakpoint 1, journal_invalidatepage (journal=0x6c06e800, page=0x61502e30, offset=0) at fs/jbd/transaction.c:2038
2038 unsigned int curr_off = 0;
(gdb) p bh
$1 = ( struct buffer_head *) 0x6bd5f0c8
(gdb) p *bh
$2 = {b_state = 3211305, b_this_page = 0x6bd5f268, b_page = 0x61501fc0, b_blocknr = 263, b_size = 1024, b_data = 0x6a648c00 "" ,
b_bdev = 0x6bc02380, b_end_io = 0x600aa760 <end_buffer_async_write>, b_private = 0x6bdc46d8, b_assoc_buffers = {
next = 0x6bd5f110, prev = 0x6bd5f110}, b_assoc_map = 0x0, b_count = {counter = 2}}
(gdb)
|
嗯,效果不错。
另外Google到由teawater提供了对应的补丁对整个内核进行关闭-O2优化,有没有问题不知道,我暂没有测试:
http://sourceware.org/ml/gdb/2010-12/msg00009.html
PS:
错误:
arch/um/os-Linux/mem.c: In function ‘create_tmp_file’:
arch/um/os-Linux/mem.c:216: error: implicit declaration of function ‘fchmod’
make[1]: *** [arch/um/os-Linux/mem.o] Error 1
make: *** [arch/um/os-Linux] Error 2
编辑文件arch/um/os-Linux/mem.c,加入头文件:
1
|
#include <sys/stat.h>
|
即可。
【作者】张昺华