作者丨鸭血粉丝Tang
毫无疑问 Strin
g 是作为一个 Java
开发工程师天天都需要打交道的类,那么如果问你 String
字符串的最大长度是多少你知道吗?
有的小伙伴可能想都没想,就直接回答 65535
,那么问题来了,真的吗?今天阿粉就带你研究一下。
首先对于 String
我们可以有下面几种用法:
- 定义一个
String
类型的变量:private static final String STRING_TEST = "xxxxxxxxxxx";
或者String newString = "newString";
- 通过在方法中定义
String
类型的变量,通过字节流创建字符串:byte[] bytes = new byte[length];String s = new String(bytes);
;
有朋友可能会说,这两种不都是定义一个字符串变量,有什么区别吗?表面上看是没什么区别,但是实际上区别还是蛮大的。
首先第一种方式定一个静态类变量,或者普通的字符串变量,这种形式字符串是存放在栈中的;而第二种方式字符串是存放在堆中的。这个时候有的小伙伴又要问了,这存在不同的地方有什么关系呢?首先这关系可大了!
当字符串存放在栈中的时候,根据 class
文件的结果规范,我们可以看到所采用的的存储格式是这样的:
CONSTANT_Utf8_info {
u1 tag;
u2 length;
u1 bytes[length];
}
其中 u2
是一种类似于Java
中int
一样的数据类型,只是表示的是一个 2 个字节的数据类型,只不过 int
是 4 个字节,这也就意味着允许的最大长度为 65535
个字符。所以我们可以得出一个结果,当字符串存放在栈内存中的时候,字符串的长度可以达到 65535。
看到这里小伙伴又不耐烦了,说到:你看吧,我就说是 65535
吧,还不信。
别急,到这里我们才说了一半,接下来我们在看看第二种方式。很显然第二种方式不管是通过字节流的方式,还是 new
一个对象,存放的位置都是早 Java
的堆内存中,而且通过 String
的源码,我们可以看到了,底层是通过一个 char[]
数组来存放的。
private final char value[];
那么我们就知道了,字符传的大小就跟数组的长度有直接关系了,另外在定义数组长度的时候,我们最多只能定义 int
类型的最大值,也就是Integer.MAX_VALUE = 0x7fffffff;
而且 String
类的 length()
方法的返回值也可以看出来,返回的类型是 int
,数值最大也是Integer.MAX_VALUE = 0x7fffffff;
/**
* Returns the length of this string.
* The length is equal to the number of <a href="Character.html#unicode">Unicode
* code units</a> in the string.
*
* @return the length of the sequence of characters represented by this
* object.
*/
public int length() {
return value.length;
}
所以看到这里,我们又得出了一个结果,**当字符串存放在堆内存的时候,最大的长度为 Integer.MAX_VALUE = 0x7fffffff;
**。不过需要注意的是,这个数值是理论上的,其实很多虚拟机会在数组中加入一些字符,所以实际的数值是达不到这么多,另外我们在 ArrayList
中也可以看到这个验证,这里定义的最大值就是Integer.MAX_VALUE - 8;
而不直接采用最大值。
此外上面说的最大值是在我们的虚拟机有这么大的内存的前提下,如果说我们的虚拟机配置的内存比这个要小,那也是达不到这么大。我们可以通过 JVM 参数来配置虚拟机的内存大小,-Xms512m
设置堆内存初始值大小。-Xmx1024m
设置堆内存最大值。下面是阿粉在自己的电脑上测试的效果,可以看到,当开始提示Requested array size exceeds VM limit
,后面因为阿粉的电脑内存不够了,所以一直分配失败,达不到最大值,只能降低长度了。
另外还要注意一个点,那就是我们在这里说的长度针对的都是英文字符,如果是是中文的话是没有那么长的,那么如果对应中文的话字符串会有多长呢?这个问题留给大家在评论区里面回答了。
-End-