可执行文件可以是具有不同格式的二进制文件,也可以是一个文本的脚本。可执行文件映像中包含了进程执行的代码和数据,同时也包含了操作系统用来将映像正确装入内存并执行的信息。在Linux中,当前的“本地”(系统默认的)可执行文件格式是ELF[15] (Executable and Linking Format)可执行链接格式。由于先前的a.out格式难于实现共享库,不能适用于动态链接,所以目前已经全部被ELF所替换。不过,Linux仍然为 a.out保留了一个二进制处理程序,但通常是使用ELF。
Linux的加载程序一般是根据内嵌在可执行文件开头的“magic序列”(一个特殊字节序列)来识别文件,有时也会通过文件名的一些特性。例如,Java编译处理程序可以保证其文件名以.class结尾,并且文件起始前四个字节是 0xcafebabe,这是Java标准所定义的。下面是2.4版本内核在Intel体系下所提供的二进制处理程序,理论上,Linux灵活到足以处理几乎所有的目标文件格式。
(1)a.out(在fs/binfmt_aout.c中):这是为了支持原来风格的Linux二进制文件。它的存在主要是为了满足一些系统的向后兼容的需要,但是基本上a.out已经光荣退役了。
(2) ELF(在fs/binfmt_elf.c中):目前是Linux默认的二进制文件格式。该格式在可执行文件和共享库中都广泛使用。最新的Linux系统 (例如Red Hat 9)一般只预装了ELF二进制文件解释器,但是特殊情况下要决定加载a.out二进制文件,那么系统也通过模块的方式,对它提供支持。虽然ELF被作为惯用的Linux本地格式,但也和其它格式一样使用同一个加载处理程序。
(3)EM86(在fs/binfmt_em86.c中):允许在Alpha机器上运行Intel的Linux二进制文件,仿佛它们就是Alpha的本地二进制文件。
(4) Java(在fs/binfmt_java.c中):可以不必每次都定义Java字节码的解释程序就可以执行Java的.class文件。这种机制和脚本中使用的机制类似,通过把.class文件的文件名作为参数传递,处理程序返回执行整型字节码的解释程序。从用户的观点来看,Java二进制文件是作为本地可执行文件处理的。
(5)misc(在fs/binfmt_misc.c中):这是最明智地使用二进制处理程序的方法,这个处理程序通过内嵌的特征数字或者文件名后缀可以识别出各种二进制格式,不过最优秀的特性是它可以在运行期配置,而不是只能在编译期配置。因此,只要遵循其规则,就可以快速的增加对新二进制文件的支持,而不用重新编译内核,也无须重新启动机器。Linux源程序文件中的注释建议最终使用它来取代Java和EM86二进制处理程序。
(6)脚本(在fs/binfmt_script.c中):对于shell脚本、Perl脚本等提供支持。宽松一点地说,所有前面两个字符是“#!”的可执行文件,都归由这个二进制处理程序进行处理。
这些Linux支持的二进制格式,可以在内核编译链接的时候直接建立在内核之中,也可以在内核运行的时候作为模块来加载。内核保存了支持的二进制格式解释程序的列表,当试图执行一个文件的时候,每一个二进制格式都会被依次尝试,直到判断出可识别的对应的二进制格式为止。

 

==============================

Linux 查看 elf可执行文件格式的两个命令

使用objdump 和readelf 两个命令,我们可以看到elf的各个节段的 信息还有 运行时需要那些动态链接库,elf中的汇编代码等等。 我就是想用来查看 这个elf运行需要哪些 *.so 文件

#include<stdio.h>
int test()
 {
 return 0;
 }
 int main(void)
 {
 int i;
 int j =0;//printf ("sizeof (int)=%d\n",sizeof (int));
 if ( i = j )
      printf ("\ntrue\n",i);
 return 0;
 }

gcc main.c 编译后,

www.lnuxidc.com@linuxidc:~/桌面$ readelf -a a.out

ELF Header:
 Magic:   7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00 
 Class:                             ELF32
 Data:                              2's complement, little endian
 Version:                           1 (current)
 OS/ABI:                            UNIX - System V
 ABI Version:                       0
 Type:                              EXEC (Executable file)
 Machine:                           Intel 80386
 Version:                           0x1
 Entry point address:               0x8048310
 Start of program headers:          52 (bytes into file)
 Start of section headers:          5996 (bytes into file)
 Flags:                             0x0
 Size of this header:               52 (bytes)
 Size of program headers:           32 (bytes)
 Number of program headers:         8
 Size of section headers:           40 (bytes)
 Number of section headers:         36
 Section header string table index: 33Section Headers:
 [Nr] Name              Type            Addr     Off    Size   ES Flg Lk Inf Al
 [ 0]                   NULL            00000000 000000 000000 00      0   0 0
 [ 1] .interp           PROGBITS        08048134 000134 000013 00   A 0   0 1
 [ 2] .note.ABI-tag     NOTE            08048148 000148 000020 00   A 0   0 4
 [ 3] .hash             HASH            08048168 000168 000028 04   A 5   0 4
 [ 4] .gnu.hash         GNU_HASH        08048190 000190 000020 04   A 5   0 4
 [ 5] .dynsym           DYNSYM          080481b0 0001b0 000050 10   A 6   1 4
 [ 6] .dynstr           STRTAB          08048200 000200 00004c 00   A 0   0 1
 [ 7] .gnu.version      VERSYM          0804824c 00024c 00000a 02   A 5   0 2
 [ 8] .gnu.version_r    VERNEED         08048258 000258 000020 00   A 6   1 4
 [ 9] .rel.dyn          REL             08048278 000278 000008 08   A 5   0 4
 [10] .rel.plt          REL             08048280 000280 000018 08   A 5 12 4
 [11] .init             PROGBITS        08048298 000298 000030 00 AX 0   0 4
 [12] .plt              PROGBITS        080482c8 0002c8 000040 04 AX 0   0 4
 [13] .text             PROGBITS        08048310 000310 0001ac 00 AX 0   0 16
 [14] .fini             PROGBITS        080484bc 0004bc 00001c 00 AX 0   0 4
 [15] .rodata           PROGBITS        080484d8 0004d8 00000f 00   A 0   0 4
 [16] .eh_frame         PROGBITS        080484e8 0004e8 000004 00   A 0   0 4
 [17] .ctors            PROGBITS        08049f0c 000f0c 000008 00 WA 0   0 4
 [18] .dtors            PROGBITS        08049f14 000f14 000008 00 WA 0   0 4
 [19] .jcr              PROGBITS        08049f1c 000f1c 000004 00 WA 0   0 4
 [20] .dynamic          DYNAMIC         08049f20 000f20 0000d0 08 WA 6   0 4
 [21] .got              PROGBITS        08049ff0 000ff0 000004 04 WA 0   0 4
 [22] .got.plt          PROGBITS        08049ff4 000ff4 000018 04 WA 0   0 4
 [23] .data             PROGBITS        0804a00c 00100c 000008 00 WA 0   0 4
 [24] .bss              NOBITS          0804a014 001014 000008 00 WA 0   0 4
 [25] .comment          PROGBITS        00000000 001014 0000fc 00      0   0 1
 [26] .debug_aranges    PROGBITS        00000000 001110 000070 00      0   0 8
 [27] .debug_pubnames   PROGBITS        00000000 001180 000025 00      0   0 1
 [28] .debug_info       PROGBITS        00000000 0011a5 0001b5 00      0   0 1
 [29] .debug_abbrev     PROGBITS        00000000 00135a 000083 00      0   0 1
 [30] .debug_line       PROGBITS        00000000 0013dd 000180 00      0   0 1
 [31] .debug_str        PROGBITS        00000000 00155d 00008e 01 MS 0   0 1
 [32] .debug_ranges     PROGBITS        00000000 0015f0 000040 00      0   0 8
 [33] .shstrtab         STRTAB          00000000 001630 000139 00      0   0 1
 [34] .symtab           SYMTAB          00000000 001d0c 0004b0 10     35 54 4
 [35] .strtab           STRTAB          00000000 0021bc 000213 00      0   0 1
 Key to Flags:
 W (write), A (alloc), X (execute), M (merge), S (strings)
 I (info), L (link order), G (group), x (unknown)
 O (extra OS processing required) o (OS specific), p (processor specific)There are no section groups in this file.
 
Dynamic section at offset 0xf20 contains 21 entries: 用 readelf -d 命令可以单独查看这个Dynamic section
 Tag        Type                         Name/Value
 0x00000001 (NEEDED)                     Shared library: [libc.so.6]   需要的动态链接库
 0x0000000c (INIT)                       0x8048298
 0x0000000d (FINI)                       0x80484bc
 0x00000004 (HASH)                       0x8048168
 0x6ffffef5 (GNU_HASH)                   0x8048190
 0x00000005 (STRTAB)                     0x8048200
 0x00000006 (SYMTAB)                     0x80481b0
 0x0000000a (STRSZ)                      76 (bytes)
 0x0000000b (SYMENT)                     16 (bytes)
 0x00000015 (DEBUG)                      0x0
 0x00000003 (PLTGOT)                     0x8049ff4
 0x00000002 (PLTRELSZ)                   24 (bytes)
 0x00000014 (PLTREL)                     REL
 0x00000017 (JMPREL)                     0x8048280
 0x00000011 (REL)                        0x8048278
 0x00000012 (RELSZ)                      8 (bytes)
 0x00000013 (RELENT)                     8 (bytes)
 0x6ffffffe (VERNEED)                    0x8048258
 0x6fffffff (VERNEEDNUM)                 1
 0x6ffffff0 (VERSYM)                     0x804824c
 0x00000000 (NULL)                       0x0Relocation section '.rel.dyn' at offset 0x278 contains 1 entries:
 Offset     Info    Type            Sym.Value Sym. Name
 08049ff0 00000106 R_386_GLOB_DAT    00000000   __gmon_start__Relocation section '.rel.plt' at offset 0x280 contains 3 entries:
 Offset     Info    Type            Sym.Value Sym. Name
 0804a000 00000107 R_386_JUMP_SLOT   00000000   __gmon_start__
 0804a004 00000207 R_386_JUMP_SLOT   00000000   __libc_start_main
 0804a008 00000307 R_386_JUMP_SLOT   00000000   printfThere are no unwind sections in this file.
Symbol table '.dynsym' contains 5 entries:
    Num:    Value Size Type    Bind   Vis      Ndx Name
      0: 00000000     0 NOTYPE LOCAL DEFAULT UND 
      1: 00000000     0 NOTYPE WEAK   DEFAULT UND __gmon_start__
      2: 00000000     0 FUNC    GLOBAL DEFAULT UND  __libc_start_main@GLIBC_2.0 (2)
      3: 00000000     0 FUNC    GLOBAL DEFAULT UND  printf@GLIBC_2.0 (2)
      4: 080484dc     4 OBJECT GLOBAL DEFAULT   15 _IO_stdin_usedSymbol table '.symtab' contains 75 entries:
    Num:    Value Size Type    Bind   Vis      Ndx Name
 。。。。。。
     67: 00000000     0 FUNC    GLOBAL DEFAULT UND  printf@@GLIBC_2.0     68: 0804a014     0 NOTYPE GLOBAL DEFAULT ABS __bss_start
     69: 080483c4    10 FUNC    GLOBAL DEFAULT   13 test
     70: 0804a01c     0 NOTYPE GLOBAL DEFAULT ABS _end
     71: 0804a014     0 NOTYPE GLOBAL DEFAULT ABS _edata
     72: 0804848a     0 FUNC    GLOBAL HIDDEN   13 __i686.get_pc_thunk.bx
     73: 080483ce    69 FUNC    GLOBAL DEFAULT   13 main
     74: 08048298     0 FUNC    GLOBAL DEFAULT   11 _init---------------------------------------------------
www.lnuxidc.com@linuxidc:~/桌面$ objdump -d a.out   反汇编a.out:     file format elf32-i386
     ...
080482f8 <printf@plt>:
 80482f8:    ff 25 08 a0 04 08        jmp    *0x804a008
 80482fe:    68 10 00 00 00           push   $0x10
 8048303:    e9 c0 ff ff ff           jmp    80482c8 <_init+0x30>Disassembly of section .text:
 080483ce <main>:
 80483ce:    8d 4c 24 04              lea    0x4(%esp),%ecx
 80483d2:    83 e4 f0                 and    $0xfffffff0,%esp
 80483d5:    ff 71 fc                 pushl -0x4(%ecx)
 80483d8:    55                       push   %ebp
 80483d9:    89 e5                    mov    %esp,%ebp
 80483db:    51                       push   %ecx
 80483dc:    83 ec 24                 sub    $0x24,%esp
 80483df:    c7 45 f4 00 00 00 00     movl   $0x0,-0xc(%ebp)
 80483e6:    8b 45 f4                 mov    -0xc(%ebp),%eax
 80483e9:    89 45 f8                 mov    %eax,-0x8(%ebp)
 80483ec:    83 7d f8 00              cmpl   $0x0,-0x8(%ebp)
 80483f0:    74 13                    je     8048405 <main+0x37>
 80483f2:    8b 45 f8                 mov    -0x8(%ebp),%eax
 80483f5:    89 44 24 04              mov    %eax,0x4(%esp)
 80483f9:    c7 04 24 e0 84 04 08     movl   $0x80484e0,(%esp)
 8048400:    e8 f3 fe ff ff           call   80482f8 <printf@plt> 
 8048405:    b8 00 00 00 00           mov    $0x0,%eax
 804840a:    83 c4 24                 add    $0x24,%esp
 804840d:    59                       pop    %ecx
 804840e:    5d                       pop    %ebp
 804840f:    8d 61 fc                 lea    -0x4(%ecx),%esp
 8048412:    c3                       ret    
 8048413:    90                       nop    
 8048414:    90                       nop    
 8048415:    90                       nop    
 8048416:    90                       nop    
 8048417:    90                       nop    
 8048418:    90                       nop    
 8048419:    90                       nop    
 804841a:    90                       nop    
 804841b:    90                       nop    
 804841c:    90                       nop    
 804841d:    90                       nop    
 804841e:    90                       nop    
 804841f:    90                       nop    ======================================================
 关于ELF格式的链接 可以看 
1. Intel平台下Linux中 ELF文件动态链接的加载、解析及实例分析): 加载
          IBM developerWorks 中国网站 王瑞川 (jeppeterone@163.com)
2. Linkers and Loaders
http://www.iecc.com/linker/=======================================
2009-05-06 widebright 补充
上面两个命令都是 gnu binutils工具附带的,可能比较有帮助的还有addr2line 可以根据 你出错的堆栈地址找到对应的代码的行数吧。
http://www.gnu.org/software/binutils/
GNU Binutils
 The GNU Binutils are a collection of binary tools. The main ones are:ld - the GNU linker. 
 as - the GNU assembler. 
 But they also include:addr2line - Converts addresses into filenames and line numbers. 
 ar - A utility for creating, modifying and extracting from archives. 
 c++filt - Filter to demangle encoded C++ symbols. 
 dlltool - Creates files for building and using DLLs. 
 gold - A new, faster, ELF only linker, still in beta test. 
 gprof - Displays profiling information. 
 nlmconv - Converts object code into an NLM. 
 nm - Lists symbols from object files. 
 objcopy - Copys and translates object files. 
 objdump - Displays information from object files. 
 ranlib - Generates an index to the contents of an archive. 
 readelf - Displays information from any ELF format object file. 
 size - Lists the section sizes of an object or archive file. 
 strings - Lists printable strings from files. 
 strip - Discards symbols. 
 windmc - A Windows compatible message compiler. 
 windres - A compiler for Windows resource files.