目录
二,ELF
1,分段
2,工具
一,目标文件格式
目标文件和可执行文件的逻辑结构是类似的,所以一般采用同样的存储结构。
Windows中是PE(portable executable),Linux中是ELF(executable linkable format),这些都是COFF格式的变种,所以PE也称为PE-COFF
还有动态链接库、静态链接库也是采用可执行文件的格式进行存储的,准确的说,静态链接库是一些目标文件的打包。
unix的可执行文件是a.out格式,设计很简单,后来共享库出现之后,a.out搞不定,于是COFF出现了,COFF的主要贡献是段的概念。
ELF中,文件可分为四类:可重定位文件.o,可执行文件,共享目标文件(链接库),核心转储文件(core dump)
二,ELF
1,分段
目标文件按照段(segment)来存储,也叫节(section),2个概念差别不大。
目标文件中最重要的几个部分:
- 文件头:文件属性(可执行,静态链接,动态链接等)、入口地址(如果是可执行文件)、目标硬件、目标操作系统、段表(各个段的偏移地址)等
- 代码段:机器指令,.code or .text
- 数据段:已初始化的全局变量和局部静态变量,.data
- bss段:未初始化的全局变量和局部静态变量,.bss(block started by symbol)
- 各种表:其中最重要的就是符号表
bss段只在段表中记录大小,在符号表中记录符号,并没有实际存储,所以不占文件空间,
目标文件被加载的时候,给bss段根据记录的大小分配内存
PS:全局变量无论是静态的还是非静态的,放在哪个段只取决于是否初始化为非0数据,局部变量如果是静态的,也是根据是否初始化为非0数据来区分,
那么,非静态的局部变量,为什么目标文件中没有它呢?(可以查看符号表,确实没有)
因为,在一个函数结束编译的时候,非静态的局部变量都会从符号表中删掉,只留下栈指针等相关内容
(如,先把栈指针移到某个位置,然后写入一个外部输入的变量,然后把它的平方值送到别的地方,编译之后只剩下这些指令,局部变量本身就没了)
2,工具
windows中的binutils、linux中的binutils、readelf都可以用来查看elf的内容,
binutils中包含objdump工具,安装MinGW也可以使用C:\mingw64\bin目录中的objdump.exe、readelf.exe等工具
3,查看目标文件内容
代码一:
// tmp.cpp
#include<iostream>
using namespace std;
int main()
{
static int abcdefg[100]={1};
cout<<abcdefg[0];
return 0;
}
gcc -c .\tmp.cpp 其中-c表示只编译不链接
objdump -h .\tmp.o 其中-h表示查看段表
objdump -t .\tmp.o 其中-t表示查看符号表
代码二:
// tmp.cpp
#include<iostream>
using namespace std;
int main()
{
static int abcdefg[100]={0};
cout<<abcdefg[0];
return 0;
}
只把数组初始值改成了0
gcc -c .\tmp.cpp
objdump -h .\tmp.o
可以看出,数组初始化为1的话,存在data段中,初始化为0的话,存在bss段中。