目录

​一,目标文件格式​

​二,ELF​

​1,分段​

​2,工具​

​3,查看目标文件内容​



一,目标文件格式

目标文件和可执行文件的逻辑结构是类似的,所以一般采用同样的存储结构。

Windows中是PE(portable executable),Linux中是ELF(executable linkable format),这些都是COFF格式的变种,所以PE也称为PE-COFF

还有动态链接库、静态链接库也是采用可执行文件的格式进行存储的,准确的说,静态链接库是一些目标文件的打包。

unix的可执行文件是a.out格式,设计很简单,后来共享库出现之后,a.out搞不定,于是COFF出现了,COFF的主要贡献是段的概念。

ELF中,文件可分为四类:可重定位文件.o,可执行文件,共享目标文件(链接库),核心储文件(core dump)


二,ELF

1,分段

目标文件按照段(segment)来存储,也叫节(section),2个概念差别不大。

目标文件中最重要的几个部分:


  • 文件头:文件属性(可执行,静态链接,动态链接等)、入口地址(如果是可执行文件)、目标硬件、目标操作系统、段表(各个段的偏移地址)等
  • 代码段:机器指令,.code or .text
  • 数据段:已初始化的全局变量和局部静态变量,.data
  • bss段:未初始化的全局变量和局部静态变量,.bss(block started by symbol)
  • 各种表:其中最重要的就是符号表

bss段只在段表中记录大小,在符号表中记录符号,并没有实际存储,所以不占文件空间,

目标文件被加载的时候,给bss段根据记录的大小分配内存

PS:全局变量无论是静态的还是非静态的,放在哪个段只取决于是否初始化为非0数据,局部变量如果是静态的,也是根据是否初始化为非0数据来区分,

那么,非静态的局部变量,为什么目标文件中没有它呢?(可以查看符号表,确实没有)

因为,在一个函数结束编译的时候,非静态的局部变量都会从符号表中删掉,只留下栈指针等相关内容

(如,先把栈指针移到某个位置,然后写入一个外部输入的变量,然后把它的平方值送到别的地方,编译之后只剩下这些指令,局部变量本身就没了)

2,工具

windows中的binutils、linux中的binutils、readelf都可以用来查看elf的内容,

binutils中包含objdump工具,安装MinGW也可以使用C:\mingw64\bin目录中的objdump.exe、readelf.exe等工具

3,查看目标文件内容

代码一:

// tmp.cpp

#include<iostream>
using namespace std;

int main()
{
static int abcdefg[100]={1};
cout<<abcdefg[0];
return 0;
}

gcc -c .\tmp.cpp   其中-c表示只编译不链接

objdump -h .\tmp.o  其中-h表示查看段表

ELF_初始化

objdump -t .\tmp.o   其中-t表示查看符号表

ELF_可执行文件_02

代码二:

// tmp.cpp

#include<iostream>
using namespace std;

int main()
{
static int abcdefg[100]={0};
cout<<abcdefg[0];
return 0;
}

只把数组初始值改成了0

gcc -c .\tmp.cpp 

objdump -h .\tmp.o 

ELF_可执行文件_03

可以看出,数组初始化为1的话,存在data段中,初始化为0的话,存在bss段中。