Java集合
什么是集合?
collection集合:集合四Java中提供的一种容器,可以用来存储多个数据(一组数据)
- Java API中定义好的一系列关于集合的类和接口放在Java.util包中
集合和数组的区别:
- 数组的长度是固定的,集合的长度是可变的
- 集合存储的元素是引用数据类型,集合也可以加做“对象容器”,可以是基本数据类型的包装类,也可以是其他复合数据类型。
集合的框架体系
注释:上图的Collection和Map不是Iterator的子类,三者是并列关系。
集合框架的组成
集合框架是由Collection、Map、和terator组成。
Collection体系中有三种集合:Set、List、Queue
- set:元素是无序的且不可重复。
- List:元素是有序且可重复
- Queue:封装了数据结构中的队列
Map体系:
- Map用于保存具有映射关系的数据,即key-value(键值对)。Map集合的key是唯一的,不可以重复,所以value可以对应多个key。
- Map体系除了常用类之外,还有Properties(属性类)也属于Map体系。
iterator(迭代器)
- 基本功能就是遍历集合中的所有元素,除了List集合有一个独有的迭代器Listiterator,别的集合类都是一样的。
- 每个集合都有iterator(),调用该方法就能得到迭代器对象
- 如果 LIst集合使用迭代器,建议使用Listiterator,比原有的迭代器多了一些方法。
- 除了使用迭代器遍历集合元素,也可以使用加强for和Java8的foreach()方法,如果是list集合,使用for循环也可以遍历。
Collection接口的方法
Collection是Set、List和Queue接口的父接口,Set、List、Queue的子类都能使用如下方法。
boolean add(E e)_______________________________添加指定元素
boolean addAll(Collection c)___________________将指定集合中所有元素都添加到此 collection
boolean contains(Object o)_____________________集合中是否包含了指定元素
boolean containsAll(Collection<?> c)___________该集合是否包含指定集合中所有元素
boolean remove(Object o)_______________________移除指定元素
boolean removeAll(Collection<?> c)_____________移除指定的collection参数的所有元素
void clear()___________________________________清除集合中所有元素
boolean retainAll(Collection<?> c)_____________保留指定Collection参数中元素,是两个集合的元素交集
boolean equals(Object o)_______________________比较此 collection 与指定对象是否相等
boolean isEmpty()______________________________判断该集合是否为空
Iterator<E> iterator()_________________________返回此 collection 的迭代器,用来遍历元素
int hashCode()_________________________________返回集合的哈希码值
int size()_____________________________________返回此 collection 中的元素数
Object[] toArray()_____________________________返回一个包含该Collection所有元素的对象数组
<T> T[] toArray(T[] a)_________________________返回一个包含该Collection所有元素的数组,数组类型和指定数组的类型一致
Collection和Collections的区别
java.util.Collection是一个集合接口。它提供了对集合对象进行基本操作的通用接口方法。Collection接口在Java类库中有很多具体的实现。Collection接口的意义是为各种具体的集合提供了最大化的统一操作方式。
而java.util.Colections是一个包装类。它包含有各种有关集合操作的静态方法。此类不能实例化,就像一个工具类,服务于Java的Collection框架。
List接口
ArrayList集合
底层是一个可变的数组,默认容量为10,可以指定初始容量,主要应用在查询和更改
- ArrayList集合里的元素是有序可以重复的。
- ArrayList集合底层的数据结构是数组,查询快,增删慢
- 线程不安全,效率高
linkedList 集合
LinkedList集合数据存储的结构是链表结构。方便元素添加、删除的集合。LinkedList提供了大量首尾操作的方法。
- LinkedList集合底层数据结构是链表,查询慢,增删快
- 线程不安全,效率高。
Vector集合
Vector集合数据结构存储的结构是数组结构,为JDK中最早提供的集合。Vector中提供了一个独特的去除方式,就是枚举ENumeration,它其实就是最早期的迭代器。此接口Enumeration的功能与Iterator接口的功能类似的。Vector集合已被ArrayList替代。枚举Enumeration已被迭代。
Vector与ArrayList集合的区别
List:有序,有索引,可重复
ArrayList底层数据结构是数组结构,是线程不同步(不安全的)查询速度很快,但是增删较慢。
构造一个初始容量为10的空列表,当放满了10个元素后,以50%的长度加长集合容器的长度。
List接口的大小可变数组的实现,即:可以直接指定容量大小
LinkedList:底层数据结构是链表结构。对元素的增删速度很快。但是查询速度很慢。线程是不同步的。
Vecto:底层数据结构也是数组结构,是线程同步的(安全的)效率低,被ArrayList替代了。1.2版本以后的集合都是不同步的。
Set接口
特点:set集合存储元素的特性是无序且不可重复的。还有Set是基于map实现的。详情可看Set实现类的源码。Set集合的大部分方法和Collection接口差不多,只有TreeSet新增了较多的方法。
HashSet
元素是无序的,因为底层操作是HashMap来完成的,所以没有重复值,但可以存入null
HashSet如何保证元素唯一性
底层数据结构是哈希表(元素是链表的数组)
哈希表依赖于哈希值存储
添加功能底层依赖两个方法:
int hashCode()
boolean equals(Object obj)
数据不重复的原因:
1、加不进去重复数据的原因:
当使用 HashSet 时,会自动调用 hashCode(),判断已经存储的 hash code 值是否与增加的 hash code 值一致,如果不一致,直接放进去,如果一致,再进行 equals 的比较,equals 方法返回 true,表示对象已经加进去了,就不会加进去新的对象,否则加进去。所以,重复与否与 equals()和 hashCode()方法有关,重写 equals 方法必须重写 HashCode()方法,反之亦然。
2、自定义对象想要实现不重复必须重写equals()和 hashCode()
查阅HashSet集合的API介绍:此类实现Set接口,由哈希表支持(实际上是一个 HashMap集合)。HashSet集合不能保证的迭代顺序与元素存储顺序相同。
HashSet集合,采用哈希表结构存储数据,保证元素唯一性的方式依赖于:hashCode()与equals()方法。Object里的hashCode()方法是用native修饰的,说明这个方法是原生函数,也就是这个方法是用C/C++语言实现的,我们看不到源码的。
对于equals和hashCode,Object规范:
1.在应用程序执行期间,只要对象的equals方法的比较操作所用的信息没有修改,那么对同一个对象的多次调用,hashCode方法都必须始终返回同一个值。
2.如果两个对象根据equals方法比较是相等的,那么调用这两个对象中的hashCode方法都必须产生同样的整数结果。
3.如果两个对象根据equals方法比较是不相等的,那么调用这两个对象中的hashCode方法,则不一定要求hashCode方法必须产生不同的结果。
但是开发人员应该知道,给不相等的对象产生不同的整数结果,有可能提高散列表性能。
一般情况下,对象不同(equals不同),hashCode一般不同。但是对象相同(equals相同),hashCode一定相同。
HashSet和HashMap的存取都是通过Key的hash值来存取的。
LinkedHashSet
是HashSet子类,使用链表维护元素次序,元素按照插入次序来排序,其他和HashSet没区别。
TreeSet
- 会对元素进行排序,元素都需要实现Comparator接口(Java常用类都已实现),如果是添加自定义的类作为元素,需要制定排序规则。
- 如果加入不同元素,则元素之间无法比较,所以TreeSet的元素都是同一类型
- 增加了许多方法,有获取头尾元素截取一部分元素和使用降序来遍历元素的迭代器。
LinkedHashSet和HashSet集合的区别
HashSet集合的特点:
- 元素唯一,无序,不能重复
- 底层结构是哈希表结构
- 元素的存与取的顺序不能保证一致
LinkedHashSet集合的特点:
- 元素唯一,有序,不能重复
- 底层结构是哈希表结构+链表结构,由链表保证元素有序,由哈希表保证元素唯一
- 元素的存与取得顺序一致
HashSet集合和TreeSet集合的区别:
HashSet集合中内容是无序的,并且不能存放重复数据
TreeSet集合中的内容是有序的,并且不能存放重复数据
HashSet底层数据结构是哈希表,该集合是线程不同步的
TreeSet它可以给Set集合中的元素进行指定方式的排序。也是线程不同步的
保证元素唯一性的方式:通过比较的结构是否为0
底层数据结构是二叉树(红黑树结构)
Map接口
Map接口方法
boolean containsKey(Object key)________________该映射是否包含指定键值
boolean containsValue(Object value)____________如果该键值对中有一个或多个key射到指定值,则返回 true
Set<Map.Entry<K,V>> entrySet()_________________返回此映射中包含的映射关系的 Set 视图。
Set<K> keySet()________________________________返回此映射中所有键的 Set 视图。
Collection<V> values()_________________________返回一个此映射中包含的值的 Collection
V get(Object key)______________________________返回指定键映射的值。如果不存在,则返回 null
V put(K key, V value)__________________________放入一个键值对(key-value)
void putAll(Map<? extends K,? extends V> m)____把指定映射的所有映射关系复制到此映射中
boolean isEmpty()______________________________如果此映射未包含键值映射关系,则返回 true
boolean equals(Object o)_______________________比较指定的对象与此映射是否相等
int size()_____________________________________返回此映射中的键-值映射关系数
int hashCode()_________________________________返回此映射的哈希码值
Map体系
- Map用于保存具有映射关系的数据,即Key-Value(键值对)。Map集合的Key是唯一的,不可重复,而value可以重复。所以一个value可以对应多个key
- Map体系除了常用类之外,还有Properties(属性类)也属于Map体系
HashMap集合
- 无序,键不重复,值可重复
HashMap类基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。(除了非同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。 此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get 和 put)提供稳定的性能。迭代 collection 视图所需的时间与 HashMap 实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。所以,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
注意:
键是哈希表结构,可以保证键的唯一性。每次操作的是一对对象,即二元偶对象,Map 中的每个元素都使用“key–>value”的形式存储在集合中。HashMap的键值key不能一样,value值可以重复。
如果key值一样,两次添加后前面的值会被后面的覆盖。
TreeMap
- 可排序,两个构造器
无参构造器:元素所在类必须实现Comparable接口
带有临时比较器的构造器,临时实现Comparator接口
这个接口是用于排序的类
LinkedHashMap
有序,键不重复,值可以重复