第三章 数据类型和变量
程序的基本功能就是处理数据,程序用变量表示数据。
在程序中,必须先定义变量,才能使用它。
定义变量指的是设定变量的数据类型和变量的名字。
定义变量的基本语法为:
数据类型名 变量名
例如:
int result = 1;
以上代码中的“=”为赋值运算符,用于把右边表达式的值赋给左边的变量。
Java语言把数据类型分为基本类型和引用类型:
基本类型:
- 数值类型
- 浮点数类型
- float
- double
- 整数类型
- byte
- short
- int
- long
- char
- boolean
引用类型:
- 引用
- 类类型
- 接口类型
- 数组类型
3.1 基本数据类型
基本数据类型的取值范围:
数据类型 | 关键字 | 在内存中占用的字节数 | 取值范围 | 默认值 |
布尔型 | boolean | 1个字节(8位) | true,false | false |
字节型 | byte | 1个字节(8位) | -127~128 | 0 |
字符型 | char | 2个字节(16位) | 0~2^16-1 | '\u0000' |
短整型 | short | 2个字节(16位) | -215~215-1 | 0 |
整型 | int | 4个字节(32位) | -231~231-1 | 0 |
长整型 | long | 8个字节(64位) | -263~263-1 | 0 |
单精度浮点型 | float | 4个字节(32位) | 1.4013E-45~3.4028e+38 | 0.0F |
双精度浮点型 | double | 8个字节(64位) | 4.9E-324~1.7977E+308 | 0.0D |
3.1.1 boolean类型
boolean类型的变量的取值只能是true或false
Java虚拟机对boolean类型的处理比较特别。
当Java编译器把Java源代码编译为字节码时,会用int或byte来表示boolean。在Java虚拟机中,用整数零来表示false,用任意一个非零整数来表示true。
在Java源程序中,不允许把整数或null赋值给boolean类型的变量。
3.1.2 byte、short、int和long类型
这四种类型都是整数类型,并且都是有符合整数。
- 有符号数:把二进制的首位作为符号位,当首位时零时,对应10进制的正整数,当首位是1时,对应十进制的负整数。对于1个字节的二进制数,对应十进制的整数的范围是-128~127
- 无符号整数:把二进制的所有位转换为正整数。对于1个字节的二进制数,对应十进制数的取值范围是0~256
- 选择合适的整数类型:
在定义一个变量时,到底要选用哪种数据类型,需要同时考虑实际需求和程序的性能。
在Java语言中,如果数学表达式中都是整数,那么表达式的返回值只能是long或int类型,如果把返回值赋给byte类型,则必须进行强制类型转换。
- 给整数类型变量赋值
如果一个整数值在某种整数类型的取值范围内,就可以直接赋值给这种类型的变量,否则必须进行强制类型转换。
Java语言允许把二进制(以0b开头)、八进制(以0开头)、十六进制(以0x开头)和十进制数赋给整数类型变量。
- 用符合“_”分割数字,提高可读性。
例如:
int a = 1000000;
int a = 1_000_000;
以上代码作用完全相同,区别在于第二段代码具有更好的可读性。可以清晰的看到数字的长度。
3.1.3 char类型与字符编码
char是字符数据类型,Java语言对字符采用Unicode字符编码。
常见的字符编码包括:
- ASCII编码
- ISO-8859-1编码
- GB2312编码
- GBK编码
- Unicode编码
- UTF编码
Java语言采用UCS-2编码,字符占两个字节。
Java语言把字符同时作为无符号整数对待,取值范围是0~2^16-1
常见的转义字符:
转义字符 | 描述 |
\n | 换行符,将光标定位在下一行的开头 |
\t | 垂直制表符,将光标移到下一个制表符的位置 |
\r | 回车,将光标定位在当前行的开头,不会跳到下一行 |
\\ | 代表反斜杠字符 |
\' | 代表单引号字符 |
\" | 代表双引号字符 |
3.1.4 float和double类型
Java语言支持两种浮点类型的小数
- float:占4个字节,共32位,称为单精度浮点数
- double:占8个字节,共64位,称为双精度浮点数
3.2 引用类型
引用类型可分为:类引用类型,接口引用类型和数组引用类型。
以下代码定义了3个引用变量:
Doll doll;
java.lang.Runnable myThread;
int[] intArray;
- doll变量位类引用类型,引用这个类或其子类的实例
- myThread变量为接口引用类型,引用实现了这个接口的类的实例
- intArray变量为数组引用类型,引用这个数组类型的实例
注意:在Java中,数组也被看作对象,所以说,不管何种引用类型的变量,它们引用的都是对象
3.2.1 基本类型和引用类型的区别
- 基本类型代表简单的数据类型,引用类型所引用的实例能表示任意一种复杂的数据结构。
- 基本类型仅表示数据类型,而引用类型所引用的实例除了表示复杂数据类型,还能包括操作这种数据类型的行为。
- Java虚拟机处理引用类型变量和基本类型的方式不一样:对于基本类型的变量,Java虚拟机会为其分配数据类型实际占用的内存大小,而对于引用类型变量,它仅仅是一个指向堆区中的某个实例的指针。
3.2.2 用new关键字创建对象
当一个引用类型的变量被声明后,如果没有初始化,那么它不指向任何对象。
Java语言用new关键字创建对象,它有以下作用:
- 为对象分配内存空间,将对象的实例变量自动初始化为其变量类型的默认值。
- 如果实例变量在声明时被显式初始化,那就把初始化值赋给实例变量。
- 调用构造方法
- 返回对象的引用
3.3 变量的作用域
变量的作用域是指它的存在范围,只有在这个范围内,程序代码才能访问它。
变量的作用域决定了变量的生命周期,变量的生命周期是指从一个变量被创建并分配内存空间开始,到这个变量被销毁并清除内存的过程。
按照作用域的不同,变量可分为以下类型:
- 成员变量:在类中声明,作用域整个类
- 局部变量:在一个方法的内部或方法的一个代码块的内部声明。如果在一个方法内声明,则作用域为整个方法,如果在一个方法的某个代码块的内部声明,则作用域是这个代码块(代码块是指一对大括号内的代码)
- 方法参数:方法或者构造方法的参数,它的作用域是整个方法或构造方法
- 异常处理参数:是指catch(Exception e)语句中的异常参数e,作用域是紧跟catch语句后面的代码块。
成员变量可以在类中的方法外的任何地方定义,而局部变量必须先定义后使用。
3.3.1 实例变量和静态变量的生命周期
类的成员变量有两种,一种是被static关键字修饰的变量,叫类变量,或静态变量;一种是没有static修饰的变量,叫实例变量。
- 类的静态变量在内存中只有一个,Java虚拟机在加载类的过程中为静态变量分配内存,静态变量位于方法区。被类的所有实例共享。静态变量可直接通过类名访问。静态变量的生命周期取决于类的声明周期,当加载类的时候,静态变量被创建并分配内存,当卸载类的时候,静态变量被消耗并撤销内存。
- 类的每个实例都有相应的实例变量。每创建一个类的实例,Java虚拟机就会为实例变量分配一次内存,实例变量位于堆区中,实例变量的生命周期取决于实例的声明周期,当创建实例的时候,实例变量被创建并分配内存;当销毁实例的时候,实例变量被销毁并撤销内存。
静态变量可以作为所有实例的共享数据,它不依赖于特定的实例;而实例变量属于特定的实例。
3.3.2 局部变量的生命周期
局部变量的生命周期取决于方法何时被调用及结束调用。
- 当Java虚拟机(确切的说,是Java虚拟机中的某个线程)调用一个方法时,会为这个方法的局部变量分配内存。
- 当Java虚拟机结束调用一个方法时,会结束这个方法中局部变量的生命周期。
3.3.3 成员变量和局部变量同名
在同一个作用域内不允许定义同名的多个变量。
在一个方法内,可以定义和成员变量同名的局部变量和方法参数,此时成员变量被屏蔽。如果要访问实例变量,可以使用this关键字。this为当前实例的引用。如果要访问类变量,可以通过类名访问。
3.3.4 将局部变量的作用域最小化
将局部变量的作用域最小化可以增加代码的可读性和 可维护性,并且降低出错的可能性。
将局部变量的作用域最小化,应该遵守以下规则
- 在需要使用某局部变量时,才定义它。
- 使方法小而集中。如果一个方法包含多种操作,尽可能把这个方法分解为多个小方法,每个方法负责一项操作。
3.4 对象的默认引用:this
当一个变量创建好后,Java虚拟机就会给他分配一个引用自身的指针:this。所有对象默认的引用名均为this。
在程序中,以下情况会使用this关键字:
- 在类的构造方法中,通过this关键字调用这个类的另一个构造方法
- 在一个类的实例中,局部变量或参数和实例变量同名,实例变量被屏蔽
- 在一个实例方法内,访问当前实例的引用
注意:只能在构造方法或实例方法中使用this关键字,而在静态方法和静态代码块内不能使用this关键字
3.5 参数传递
如果方法A调用方法B,那么称方法A是方法B的调用者。如果方法B的参数是基本数据类型,那么方法A向方法B传递参数的值;如果方法B的参数是数组或对象,那么方法A向方法B传递对象或数组的引用。
3.6 变量的初始化和默认值
程序中的变量用域表现现实系统中的某种数据。
Java语言要求变量遵循先定义,初始化再使用的规则。
变量的初始化是指自从定义变量以后,首次给它赋值的过程。
3.6.1 成员变量的初始化
对于类的成员变量,不管程序有没有显式的进行初始化,Java虚拟机会自动给它初始化为默认值。
3.6.2 局部变量的初始化
局部变量声明之后,Java虚拟机不会自动给它初始化为默认值。因此局部变量必须显式初始化。
如果局部变量没有初始化,并且在方法中一直没有被使用,编译和运行都会通过
3.7 直接数
直接数是指直接赋给变量的具体数值。
3.7.1 直接数的类型
- int型直接数
- long型直接数
- float型直接数
- double型直接数
- boolean型直接数
- char型直接数
- String型直接数
Java的直接数具有以下特点:
- 对于基本数据类型,除了byte和short类型,都有相应的直接数
- 对于整数,如果在int类型的取值范围内,就是int型直接数;如果在long类型的范围内,就是long型直接数。
- 对于long、float和double型直接数,可以分别加上后缀L、F或D
- 如果一个小数没有任何后缀,那么它是double型直接数
- 对于引用类型,只有String类型具有直接数
- String类型和char类型的直接数的区别是:前者表示字符串,位于双引号内,后者表示字符,位于单引号内。
3.7.2 直接数的赋值
直接数的赋值具有以下特点:
- 基本类型直接数不允许赋值给String类型变量,反之亦然。
- boolean类型的直接数只能赋值给boolean类型,boolean类型的变量只接受boolean类型的直接数。
- 把int类型的直接数赋值给byte、short或char类型的变量时,如果直接数的值位于该变量的取值范围内,就允许直接赋值;否则必须进行强制类型转换。
- 把float类型和double类型直接数赋值给整型变量时,必须进行强制类型转换;而把整型直接数赋值给float或double类型变量时,允许直接赋值。
- 把double型直接数赋值给float类型时,必须经过强制类型转换;把float直接数赋值给double类型时,可以直接赋值。