我们先了解一下都可以存储数据的数组与集合有什么不同:
数组:数组长度固定,只能存储同一元素类型,元素类型可以是基本元素类型或者引用类型。
集合:集合长度不固定,可以存储多种类型元素,元素类型必须是Object子类,不可以存储基本数据类型。
数组的效率高于集合。
java中集合类关系图见图,其中虚线框代表是接口。
Collection关系介绍
List:List接口的实现类可以盛放重复元素,且元素排列是有序的。
ArrayList:ArrayList的存储结构是基于数组实现的,而数组存储元素是含有下标的,因为有下标的特点所以ArrayList集合查询效率会更高。但是添加元素或者删除元素效率并不高,比如一个存放了十个集合,此时删除第一个元素时,后面九个元素都需要向前移动一位。(此时LinkedList就出现了)
LinkedList:ArrayList的存储结构是基于链表实现的,而链表结构的特点决定了它的增删元素的效率更高,但是查询的效率低。
Set:Set接口的实现类不可以盛放重复元素,且元素排列顺序是无序的(TreeSet除外)。
Set判断元素是否重复的规则是先比较元素之间的hashCode方法返回值,元素之间再用equals方法判断,如果hashCode方法返回值相同并且equals方法返回true,则判定为重复元素。这也解释了在对象中equals方法与hashCode如果重写的话最好都重写的原因。
新建一个Cat类并重写equals方法与hashCode方法。
测试:
HashSet的存储方式:
HashSet中有长度为16的table数组,添加的元素就存在这个数组下。添加元素时首先计算元素的hashCode值,并且该值与1111进行与运算(&1111),之后的十进制值就是该元素在table数组中的位置。如果有第二个元素与第一个元素在table中存储位置相同时(hashCode值 & 1111 相同)就执行equals方法,返回true时去重,返回false时就放在同一位置下形成链表。一个链表的最大长度是16。
进行测试:
此时我们改写Cat类的equals方法,只有id与name都相同的时候才返回true。
通过Debug模式可以查看:
此时安迪与詹妮都在table[15]中
杰瑞在table[12]中
TreeSet的存储方式:
TreeSet的特点就是会对元素进行排序,如果元素是自定义对象,这个对象就需要实现Comparable接口并重写compareTo比较方法。
我们为cat对象实现Comparable接口重写compareTo比较方法,用他们的id进行比较:
测试:
LinkedHashSet,去重效率最高,数据结构与LinkedList一样是基于链表形式存储:
map集合特点:键值对方式存储,key不可以重复无序(Set集合),val可以重复(List集合)且有序
map中有hashMap\hashtable
HashMap与HashTable不同:
1.HashMap的键值都可以为null,而HashTable的键值都不可以为空。
2.HashMap是非线程安全的,HashTable是线程安全的。
3.HashTable的性能比较低。
hashMap存储元素的方式与插入重复key值的处理方式
HashMap存储元素是利用key-value键值对的方式进行存储,一个key对应一个value。
HsahMap中存入元素时首先获取key的hashcode值来决定value的存储位置并存放value值。如果此时多个key元素存储位置相同(hsahcode值相同),此时就比较key是否相同(用equals方法),如果rquals方法返回true,那么就认为kay值完全相同,map中完全相同的key只能有一个value值与之关联,所以此时后添加的value就会覆盖之前添加的value。如果返回false则在这个key原来的value之后再追加一个value形成一个链。
此时两个key值aaa完全相同,那么最新的value值“AAA1”就覆盖了旧的value值“AAA”。