集合长度可变的实现原理
- 首先我们要明白java中的集合Collection,List,ArrayList之间的关系:
- 言归正传:我们下面说一下集合的长度为什么是不固定的!
首先我们要明白java中的集合Collection,List,ArrayList之间的关系:
ArrayList是具体的实现类,实现了List接口;
List是接口,继承了Collection接口;
List继承了Collection接口,但是List是可以重复的并且有序的集合,Collection是不可重复且无序的。
这里我们先讲一下List集合:
List接口不能被构造 也就是我们说的不能创建实例对象 但是我们可以像下面那样为List接口创建一个指向自己的对象引用 而ArrayList实现类的实例对象就在这充当了这个指向List接口的对象引用 这也是多态的一种:
List list = new ArrayList();
那么现在问题来了
为什么要用 List list = new ArrayList() 而不用 ArrayList alist = new ArrayList()呢?
问题就在于List接口有多个实现类,现在你用的是ArrayList,也许哪一天你需要换成其它的实现类,如 LinkedList或者Vector等等,这时你只要改变这一行就行了;
List list = new LinkedList(); 其它使用了list地方的代码根本不需要改动
假设你开始用ArrayList alist = new ArrayList() ,那需要改的地方就很多了,特别是如果你使用了ArrayList实现类特有的方法和属性。
这样的好处也是为了代码的可维护性 可复用性 可扩展性以及灵活性 再者就是这符合了***里氏代换原则***和***开闭原则***
言归正传:我们下面说一下集合的长度为什么是不固定的!
我们知道集合的底层其实也是用数组实现的 那么为什么定义集合的时候 是不需要给出size的 而数组在定义的时候就需要给出长度?
首先我们分析一下ArrayList的无参构造方法:
/**
* Constructs an empty list with an initial capacity of ten.
*/
public ArrayList() {
super();
this.elementData = EMPTY_ELEMENTDATA;
}
/**
* Default initial capacity.
*/
private static final int DEFAULT_CAPACITY = 10;
/**
* Shared empty array instance used for empty instances.
*/
private static final Object[] EMPTY_ELEMENTDATA = {};
/**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer. Any
* empty ArrayList with elementData == EMPTY_ELEMENTDATA will be expanded to
* DEFAULT_CAPACITY when the first element is added.
*/
private transient Object[] elementData;
我们发现无参的构造方法里面 this.elementData = EMPTY_ELEMENTDATA; 相当于给集合了一个空的数组 而且上面代码紫色部分说在第一次给集合添加元素的时候 会把 DEFAULT_CAPACITY 也就是10设置成数组长度。
那么我们通过ArrayList中的add方法看一看是否是这样子:
/**
* The size of the ArrayList (the number of elements it contains).
*
* @serial
*/
private int size;
/**
* Appends the specified element to the end of this list.
*
* @param e element to be appended to this list
* @return <tt>true</tt> (as specified by {@link Collection#add})
*/
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
//这里elementData==EMPTY_ELEMENTDATA 也就是上面无参构造方法里的的赋值, 所以这里的判断可以理解为是否是第一次添加元素时调用此方法
if (elementData == EMPTY_ELEMENTDATA) {
//如果是第一次添加元素 minCapacity应该为0+1 所以这里把DEFAULT_CAPACITY也就是10赋值给minCapacity
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
//这里判断新添加一个元素以后 长度是否大于当前数组 如果大于则给数组扩容
//如果是第一次添加元素 肯定是true 然后把10传到grow方法中去
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
/**
* Increases the capacity to ensure that it can hold at least the
* number of elements specified by the minimum capacity argument.
*
* @param minCapacity the desired minimum capacity
*/
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
//这里是给扩容后的数组定义的长度
int newCapacity = oldCapacity + (oldCapacity >> 1);
//如果是第一次添加元素 new肯定是小于min的 所以把10赋给newCapacity 用来创建长度为10的新数组
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
//把原来的数组copy到新数组中 如果是第一次add 则创建了一个长度为10的数组
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
通过上面的代码 我们可以发现:
在第一次给集合添加元素的时候,的确会通过add方法及方法内调用的其他方法,创建一个长度为10的数组。
并且以后每次add的时候,都会先判断一下 size+1是否超过了数组的长度,如果超过了长度就重新定义一个长度
int newCapacity = oldCapacity + (oldCapacity >> 1) 的数组,然后把旧数组复制到新创建的数组中返回。
解释一下 int newCapacity = oldCapacity + (oldCapacity >> 1); (oldCapacity >> 1)的意思是oldCapacity转换成2进制然后右移一位 也就是oldCapacity /2
综上所述 第一次给集合添加元素的时候 集合中数组的长度会被设置成10 每次数组元素满了以后 重新给数组设置的长度为 原数组长度+(原数组长度/2) (这里跟C#不同,C#中是初始长度为4 新数组长度=原数组长度*2)