一、前言
java文件运行后会自动编译生成class文件,这个文件呗成为classfile,存储格式类似于C语言。它是由8个字节为单位的二进制流组成的文件,各个数据紧密排列,没有分隔符。使得class文件几乎全都是程序式运行。
我们常用来查看classfile文件的工具:
Sublime_Text-----和------idea中的插件Bined
二、class文件解析
因为是类似C语言的结构存储形式,所以只拥有2中数据结类型:无符号数和表。
1.无符号数
无符号数:
属于基本数据类型 主要用于描述数字 索引符号 数量值 或者按照UTF-8编码构成的字符串值
数据类型 U1 U2 U4 U8 也只是逻辑上的区分。
u1 —表示一个字节----------u2 —表示两个字节
u4 —表示四个字节----------u8 —表示八个字节
2.表
由多个无符号数或者其他表作为数据项构成的复合数据类型,所有的表都习惯以_info结尾 表主要用于描述有层次关系的复合结构数据。 比如 方法、字段 需要注意的是class文件没有分隔符,整个Class文件本质上就是一张表,如下所示:
3.魔术
1 .每一个class文件的头4个字节 被称为魔数 magicNumber
2 . 唯一作用是用于确定这个文件是否为一个能被虚拟机接受的class文件
Class文件魔数值为0xCAFEBABE 如果以个文件不是以CAFEBABE开头,那么它就肯定不是java的class文件。
那么它也是java.class的识别魔数。
很多的文件存储标准中都使用魔数来识别文件的身份。 譬如图片格式.gif 或 jpeg等在文件的头部都存有魔数,使用魔数而不是文件的扩展名称来判断 ,这种情况是处于安全的考虑。因为文件的后缀可以更改,但对魔术的更改相对困难,所以出于安全检测而言魔术检测更为安全。
4.class文件版本号
紧挨着魔数的4个字节表示class的文件的版本号 版本号:
1.次版本号 --minor_version 前2个字节用于表示次版本号
例如:00 00
2.主版本号 --major_version 后2个字节用于表示主版本号
例如: 00 34
这个版本号随
着jdk版本的不同而表示不同版本的范围。Java的版本号是从45开始的
如果class的版本号超过虚拟机的版本 会被拒绝执行,一下是一些JDK对应的版本号:
JDK1.2 ----0X002E 46
JDK1.3 ----0X002F 47
JDK1.4 ----0X0030 48
JDK1.5 ----0X0031 49
JDK1.6 ----0X0032 50
JDK1.7 ----0X0033 51
JDK1.8 ----0X0034 52
5.常量池
紧跟着魔数与版本号之后的是常量池入口,常量池简单理解为class文件的资源库。
1.它是class文件结构中与其他项目关联最多的数据类型
2.是占用class文件空间最大的数据项目之一
3.是在文件中第一个出现的表类型数据项目。
onstant_pool_count(常量的个数)
class文件结构中只有常量池的容量计数是从1开始的。第0项腾出来满足后面某些指向常量池的索引值的数据,在特定的情况下需要表达“不引用任何一个常量池项目” 把索引值的第0项留给JVM自己用。
从表可知其是1个U2的数据。所以0x22转为10进制减去第0项得出33个常量池onstant_pool常量池
常量池中主要存放两大类常量:
1.字面量: 比较接近java语言层面的常量的概念 比如 字符串 被final关键字声明的常量值。
2.符号引用: 属于编译原理方面的概念 包括三项:
类和接口的全名
字段的名称和描述符
方法的名称和描述符
在加载class文件的时候 是进行动态连接的。在class文件中不会保存各个方法和字段的最终内存布局信息。(需要经过转换) 当虚拟机运行时 需要从常量池获得对应的符号引用,再在类创建时或者运行时解析并翻译到具体的内存地址中。
CONSTANT_POOL 表示的是类型数据集合,在该常量池中,每一项常量都是一个表 共有14种 -----JDK1.7版本,这14种结构的表都是不相同的结构数据。14个表都有一共同的特点,都是由u1的标志位开始的,可以通过这个标志位来判断这个常量属于哪种常量的类型。
常量池详细解析常量类型
总共有18个编号的常量类型。
编号1: CONSTANT_UTF8_INFO
TAG1 ------占用一个空间字节
Length: utf-8字符串占用的字节数
Bytes 长度为length字符串
用于表示utf-8的编码的字符串
编号3 CONSTANT_integer_info
Tag3
Bytes 4个字节 Big_Endian(高位在前) 存储int类型的值
编号4 CONSTANT_float_info
Tag4
Bytes 4个字节 Big_Endian(高位在前) 存储float类型的值
编号5 CONSTANT_long_info
Tag5
Bytes 8个字节 Big_Endian(高位在前) 存储long类型的值
编号6 CONSTANT_double_info
Tag6
Bytes 8个字节 Big_Endian(高位在前) 存储double类型的值
编号7 CONSTANT_Class_info
Tag7
Index 2个字节 指向类的全限定名的项的索引
类和接口符号引用
编号8 CONSTANT_String_info
Tag8
Index 2个字节 指向字符串的字面量的索引
编号9 CONSTANT_Fieldref_info
Tag9
Index 2个字节 指向声明字段的类或接口的描述符 CONSTANT_Class_info的索引项
Index 2个字节 指向字段描述符CONSTANT_NameAndType的索引项
字段的符号引用
编号10 CONSTANT_Methodref_info
Tag10
Index 2个字节 指向声明字段的类或接口的描述符 CONSTANT_Class_info的索引项
Index 2个字节 指向字段描述符CONSTANT_NameAndType的索引项
类中方法的符号引用
编号11 CONSTANT_InterfaceMethodref_info
Tag11
Index 2个字节 指向声明字段的类或接口的描述符 CONSTANT_Class_info的索引项
Index 2个字节 指向字段描述符CONSTANT_NameAndType的索引项
接口中方法的符号引用
编号12 CONSTANT_NameAndType
Tag12
Index 2个字节 指向该字段或方法名称常量项的索引
Index 2个字节 指向该字段或方法描述符常量项的索引
字段或方法的符号引用
编号15 CONSTANT_MethodHandler_info
Tag15
Reference_kind 1个字节 1-9之间的一个值 决定了方法句柄的类型。方法句柄类型的值表示方法句柄的字节码行为
Reference_index 2个字节 对常量池的有效索引。
表示方法句柄
编号16 CONSTANT_MethodType_info
Tag16
Descriptor_index 2个字节 指向UTF8_info 结构表示的方法描述符
编号18CONSTANT_InvokeDynamic_info
Tag18
Bootstrap_method_attr_index: 2个字节 当前class文件中引导方法表的bootstrap_methods[] 数组的有效索引
Name_and_type_index: 2个字节 指向NameAndType_info 表示方法名和方法描述符。
表示动态方法的调用点。
6.access_flag(类的访问控制权限)
用于表示对该类或接口的访问权限以及该类或接口的属性
7.this_class
该this_class 项目的值 必须是constant_pool表中的有效索引,该constant_pool索引处的条目必须是表示此文件定义的类或接口 CONSTANT_Class_info 结构class
8.super_class
必须是constant_pool表中的有效索引, 如果super_class的值不为0 则constant_pool中的条目必须为CONSTANT_Class_info 结构 这个结构表示此类的文件定义的类的直接超类。直接超类不能在其classfile结构的access_flag项中设置 ACC_FINAL 标志。
其实要描述的意思就是说 如果superclass指代的超类,那么它就不能被final修饰。
8.JClasslib
安装失败的话可以从官网下载进行本地导入
9.intefaces_count和 intefaces
intefaces_count表示的接口的数量,两个字节
intefaces 表示接口名,两个字节
10.fields_count 和 fields
fields_count表示域的数量,两个字节
fields 表示域的表
1.名称access_flag 类型u2 数量1个
2.名称 name_index 类型u2 数量1个 -
3. 名称 descriptior_index 类型u2 数量1个
4. 名称 descriptior_index 类型u2 数量1个
(1) 参数列表(参数类型) 后-返回值
(2) void m() 等同于 ()V
(3) String toString() ->()Ljava/lang/String;
(4) Long pos(int[] arr1,int arr2,long length) ->([IIJ)J
[ 一维数组
[[ 表示二维数组
(5)attributes_count 附加属性的数量
(6)attributes 附加属性
11.method_count(方法的数量) 和 method(方法表)
1.名称access_flag 类型u2 数量1个
2.名称 name_index 类型u2 数量1个 -
3. 名称 descriptior_index 类型u2 数量1个
4. 名称 descriptior_index 类型u2 数量1个
(1) 参数列表(参数类型) 后-返回值
(2) void m() 等同于 ()V
(3) String toString() ->()Ljava/lang/String;
(4) Long pos(int[] arr1,int arr2,long length) ->([IIJ)J
[ 一维数组 [[ 表示二维数组
(5)attributes_count 附加属性的数量
(6)attributes 附加属性
12.attribute_count 和 attribute
attribute_count 表示附加的属性数量 两个字节
attribute 表示附加属性表
附加属性 方法中的附加属性就是code,那么code在这里是比较重要的概念,code是具体代码的实现,当我们写入方法的时候,它能够把方法中代码转化为一条条指令。
Attributes附加属性
附加属性中 有的代码中存在内容,有的不存在内容
1.既有预定义的属性,也可以自定义 java虚拟机会自动忽略它不认识属性
2. Code 表示的是方法表 方法表能够编译成字节码指令,还存放了操作数栈和局部变量的信息
u2 attribute_name_index 指向常量池中的CONSTANT_UTF8_info 存放的当前属性的名字就是code。
u4 attribute_length 表示的code属性的长度 (不包括前6个字节)。
u2 max_stack 指定当前方法被执行引擎执行的时候,在栈帧中需要分配的操作数栈的大小
u2 max_locals 指定当前方法被执行引擎执行的时候,在栈帧中需要分配的局部变量表的大小
u4 code_length 指定方法字节码的长度, class文件中每条字节码都占用一个字节
u1 code 存放字节码指令本身,它的长度是code_length个字节。
U2 exception_table_length指定异常表的大小
Exception_table异常表 作用对try-catch-finally的描述,可以把它看成是一个数组。每一个数组项都是一个exception_info结构, 一般来说每个catch块对应一个exception_info,编译器也可能会对当前的方法生成一些exception_info.
u2 start_pc 是从字节码code属性中的一部分 起始处到当前异常处理器的起始处的偏移量量
u2 end_pc 从字节码起始处到当前异常处理器 末尾的偏移量
u2 handler_pc 是指当前异常处理器用于处理异常(即catch块)的第一条指令相对于字节码开始处的偏移量。
u2 catch_type 是常量池的索引 指向的是常量池CONSTANT-Class_info 数据项,描述了catch块中的异常类型的信息。这个类必须是java.lang.Throwable的或者是它的子类。