了解Java的hashCode方法
hashCode()是什么?
hashCode()方法是Object类中就有的一个方法。
public native int hashCode();
该方法是native方法,意味着这个方法的实现是依赖于底层的,普遍认为Object类中的方法返回的是这个对象的物理地址。
看看这个方法的描述:
Returns a hash code value for the object. This method is supported for the benefit of hash tables such as those provided by java.util.HashMap.
位这个对象返回一个hash code,这个方法主要效力于比如HashMap等哈希表。
Object类中对hashcode方法特性的描述(英语翻译的不好):
- 同一个对象多次调用将返回相同的hash code
- 如果两个对象是相等的,也就是equals(Object)方法返回true的话,分别调用这两个对象的hashCode()方法应该返回相同的结果。
- 如果两个对象不相等,也就是equals(Object)方法返回false的话,分别调用这两个对象的hashCode()方法并不要求返回相同的结果。然而程序员应当意识到为不相同的对象提供能返回独有的hash code的方法能提高程序效率。
再看看Object类中的equels()方法:
public boolean equals(Object obj) {
return (this == obj);
}
很明显Object类中的equals()方法是直接比较的两个对象的引用是否相等,也就是地址是否相等。与上述描述吻合。
从上面可以看出hashCode()方法的作用主要是为一些具有哈希表结构的功能服务的,以及两个对象如果相同必定返回相同的hash code。并且Object类自带的hashCode()方法可以认为就是返回独有的结果。
String对象中的hashCode()方法。
先看String类的一些信息:
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
/** Cache the hash code for the string */
private int hash; // Default to 0
可以知道:
- String是final修饰的,因此不能被继承。
- String实现了Serializable(可序列化接口),Comparable(可比较的),CharSequence (字符序列接口)。
- String的内部是由一个char[]实现的。
- String有个hash属性,默认值是0;
再看看equals()方法:
public boolean equals(Object anObject) {
if (this == anObject) {
return true;
}
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
String重写了Object的equals()方法。实现原理很简单,如果对象地址不同,也就是一个一个字符的判断是否 相等。
再看看hashCode()方法:
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
看看hashCode()方法的描述:
Returns a hash code for this string. The hash code for a String object is computed as
s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
using int arithmetic, where s[i] is the ith character of the string, n is the length of the string, and ^ indicates exponentiation. (The hash value of the empty string is zero.)
配合代码便可以看出,String的hash code的生成公式:
s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
其中n是char[]的length,也就是31* 每个字符 *的总和。