##一、概述
在日常开发中,最重要的环节就是对数据的正确处理,而集合去重也是日常开发经常遇到的情况,下面简单根据个人开发遇到的情况,记录下集合去重的方法。
##二、案例
###1. 集合去子集
集合去子集可采用removeAll()方法,源码如下:

boolean removeAll(Collection<?> c)
Removes from this list all of its elements that are contained in the specified collection (optional operation).
Specified by:
removeAll in interface Collection<E>
Parameters:
c - collection containing elements to be removed from this list
Returns:
true if this list changed as a result of the call

调用removeAll()方法的同时,会遍历集合,调用contains()方法,检测是否有重复对象,contains方法中包含一个indexOf()方法。

public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

从此方法可以看出,这里调用了equals进行比较,因此,需要根据业务需要重写对象的equals方法。

###2. 去重
去重可以使用Set集合,Set集合本来就是设计存放无重复的集合数据的,但是HashSet与ArrayList的去重还是有点区别的。
查看源码,Set中的add()方法调用了put():

//内部使用HashMap存储
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}


public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

这段代码可以看出,对于已存在的元素会覆盖,不存在的元素直接插入,插入时hashCode()作为索引,equals()方法判断对象是否相等,因此需要重写equals和hashCode两个方法才能保证去重。

###3.equals与hashcode方法重写规则

  • 使用《Effective Java》中的做法
@Override
    public boolean equals(Object o) {
        if (o == this) return true;
        if (!(o instanceof User)) {
            return false;
        }
        User user = (User) o;
        return user.name.equals(name) &&
                user.age == age &&
                user.passport.equals(passport);
    }
   
    @Override
    public int hashCode() {
        int result = 17;
        result = 31 * result + name.hashCode();
        result = 31 * result + age;
        result = 31 * result + passport.hashCode();
        return result;
    }
  • 对于JDK7及更新版本,你可以是使用java.util.Objects 来重写 equals 和 hashCode 方法,代码如下:
@Override
    public boolean equals(Object o) {
        if (o == this) return true;
        if (!(o instanceof User)) {
            return false;
        }
        User user = (User) o;
        return age == user.age &&
                Objects.equals(name, user.name) &&
                Objects.equals(passport, user.passport);
    }
 
    @Override
    public int hashCode() {
        return Objects.hash(name, age, passport);
    }

查看第二种方法的源码,其实内部也是对第一种方法的封装。
源码部分:

public static int hashCode(Object a[]) {
        if (a == null)
            return 0;

        int result = 1;

        for (Object element : a)
            result = 31 * result + (element == null ? 0 : element.hashCode());

        return result;
    }