了解Java的hashCode方法

hashCode()是什么?

hashCode()方法是Object类中就有的一个方法。
public native int hashCode();
该方法是native方法,意味着这个方法的实现是依赖于底层的,普遍认为Object类中的方法返回的是这个对象的物理地址。

看看这个方法的描述:

Returns a hash code value for the object. This method is supported for the benefit of hash tables such as those provided by java.util.HashMap.

位这个对象返回一个hash code,这个方法主要效力于比如HashMap等哈希表。
Object类中对hashcode方法特性的描述(英语翻译的不好):

  • 同一个对象多次调用将返回相同的hash code
  • 如果两个对象是相等的,也就是equals(Object)方法返回true的话,分别调用这两个对象的hashCode()方法应该返回相同的结果。
  • 如果两个对象不相等,也就是equals(Object)方法返回false的话,分别调用这两个对象的hashCode()方法并不要求返回相同的结果。然而程序员应当意识到为不相同的对象提供能返回独有的hash code的方法能提高程序效率。

再看看Object类中的equels()方法:

public boolean equals(Object obj) {
        return (this == obj);
    }

很明显Object类中的equals()方法是直接比较的两个对象的引用是否相等,也就是地址是否相等。与上述描述吻合。

从上面可以看出hashCode()方法的作用主要是为一些具有哈希表结构的功能服务的,以及两个对象如果相同必定返回相同的hash code。并且Object类自带的hashCode()方法可以认为就是返回独有的结果。


String对象中的hashCode()方法。

先看String类的一些信息:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    /** The value is used for character storage. */
    private final char value[];

    /** Cache the hash code for the string */
    private int hash; // Default to 0

可以知道:

  • String是final修饰的,因此不能被继承。
  • String实现了Serializable(可序列化接口),Comparable(可比较的),CharSequence (字符序列接口)。
  • String的内部是由一个char[]实现的。
  • String有个hash属性,默认值是0;

再看看equals()方法:

public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }

String重写了Object的equals()方法。实现原理很简单,如果对象地址不同,也就是一个一个字符的判断是否 相等。

再看看hashCode()方法:

public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

看看hashCode()方法的描述:

Returns a hash code for this string. The hash code for a String object is computed as 

 s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]

using int arithmetic, where s[i] is the ith character of the string, n is the length of the string, and ^ indicates exponentiation. (The hash value of the empty string is zero.)

配合代码便可以看出,String的hash code的生成公式:

s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]

其中n是char[]的length,也就是31* 每个字符 *的总和。