##一、概述
在日常开发中,最重要的环节就是对数据的正确处理,而集合去重也是日常开发经常遇到的情况,下面简单根据个人开发遇到的情况,记录下集合去重的方法。
##二、案例
###1. 集合去子集
集合去子集可采用removeAll()方法,源码如下:
boolean removeAll(Collection<?> c)
Removes from this list all of its elements that are contained in the specified collection (optional operation).
Specified by:
removeAll in interface Collection<E>
Parameters:
c - collection containing elements to be removed from this list
Returns:
true if this list changed as a result of the call
调用removeAll()方法的同时,会遍历集合,调用contains()方法,检测是否有重复对象,contains方法中包含一个indexOf()方法。
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
从此方法可以看出,这里调用了equals进行比较,因此,需要根据业务需要重写对象的equals方法。
###2. 去重
去重可以使用Set集合,Set集合本来就是设计存放无重复的集合数据的,但是HashSet与ArrayList的去重还是有点区别的。
查看源码,Set中的add()方法调用了put():
//内部使用HashMap存储
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
public V put(K key, V value) {
if (table == EMPTY_TABLE) {
inflateTable(threshold);
}
if (key == null)
return putForNullKey(value);
int hash = hash(key);
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
这段代码可以看出,对于已存在的元素会覆盖,不存在的元素直接插入,插入时hashCode()作为索引,equals()方法判断对象是否相等,因此需要重写equals和hashCode两个方法才能保证去重。
###3.equals与hashcode方法重写规则
- 使用《Effective Java》中的做法
@Override
public boolean equals(Object o) {
if (o == this) return true;
if (!(o instanceof User)) {
return false;
}
User user = (User) o;
return user.name.equals(name) &&
user.age == age &&
user.passport.equals(passport);
}
@Override
public int hashCode() {
int result = 17;
result = 31 * result + name.hashCode();
result = 31 * result + age;
result = 31 * result + passport.hashCode();
return result;
}
- 对于JDK7及更新版本,你可以是使用java.util.Objects 来重写 equals 和 hashCode 方法,代码如下:
@Override
public boolean equals(Object o) {
if (o == this) return true;
if (!(o instanceof User)) {
return false;
}
User user = (User) o;
return age == user.age &&
Objects.equals(name, user.name) &&
Objects.equals(passport, user.passport);
}
@Override
public int hashCode() {
return Objects.hash(name, age, passport);
}
查看第二种方法的源码,其实内部也是对第一种方法的封装。
源码部分:
public static int hashCode(Object a[]) {
if (a == null)
return 0;
int result = 1;
for (Object element : a)
result = 31 * result + (element == null ? 0 : element.hashCode());
return result;
}