當(dāng)我們要學(xué)習(xí)Java中hashcode()方法時,我們需要一步一步弄清楚以下這幾個方面:
1.hashcode()的由來
hashcode是jdk根據(jù)對象的地址或者字符串或者數(shù)字算出來的int類型的數(shù)值,那么是通過什么算出來的呢?答案是hashtable(哈希表),哈希表就是根據(jù)關(guān)鍵碼值(Key value)而直接進(jìn)行訪問的數(shù)據(jù)結(jié)構(gòu)。這樣的話可能太過于官方,在這里說一下我的理解,hashcode就是通過一個函數(shù)映射得到的值,這個函數(shù)叫哈希函數(shù),我們向函數(shù)中傳入一個key值,就會得到一個value值,通過哈希函數(shù)得到的value就是哈希值,即value=f(key)。那么理解了hashcode之后,我們就知道hashcode()方法是干什么用的了,hashcode()方法就是為了計算并返回hashcode方法。
2.hashcode()的作用
哈希表的主要好處就是它能夠提高查找效率。通過查看API我們可以發(fā)現(xiàn),hashcode()是Object的方法,也可以說正常情況下所有類的對象都夠調(diào)用hashcode()方法,在Java中,根據(jù)他能夠提高查找效率的特點,我們主要應(yīng)用在為了配合基于散列的集合一起正常運行,這樣的散列集合包括HashSet、HashMap以及HashTable。集合中不允許重復(fù)的元素存在,那么當(dāng)我們需要加入一個新的元素時,如何去判斷該元素已經(jīng)存在了呢?也許大多數(shù)人都會想到調(diào)用equals方法來逐個進(jìn)行比較,這個方法確實可行。但是如果集合中已經(jīng)存在一萬條數(shù)據(jù)或者更多的數(shù)據(jù),如果采用equals方法去逐一比較,效率必然是一個問題。此時hashCode方法的作用就體現(xiàn)出來了,當(dāng)集合要添加新的對象時,先調(diào)用這個對象的hashCode方法,得到對應(yīng)的hashcode值,實際上在HashMap的具體實現(xiàn)中會用一個table保存已經(jīng)存進(jìn)去的對象的hashcode值,如果table中沒有該hashcode值,它就可以直接存進(jìn)去,不用再進(jìn)行任何比較了;如果存在該hashcode值, 就調(diào)用它的equals方法與新元素進(jìn)行比較,相同的話就不存了,不相同就散列其它的地址,所以這里存在一個沖突解決的問題,這樣一來實際調(diào)用equals方法的次數(shù)就大大降低了。下面這段代碼是java.util.HashMap的中put方法的具體實現(xiàn):
public V put(K key, V value) {
if (key == null)
return putForNullKey(value);
int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
put方法是用來向HashMap中添加新的元素,從put方法的具體實現(xiàn)可知,會先調(diào)用hashCode方法得到該元素的hashCode值,然后查看table中是否存在該hashCode值,如果存在則調(diào)用equals方法重新確定是否存在該元素,如果存在,則更新value值,否則將新的元素添加到HashMap中。從這里可以看出,hashCode方法的存在是為了減少equals方法的調(diào)用次數(shù),從而提高程序效率。
3.hashcode()方法與equals()方法
在這里需要注意幾個問題。判斷對象相等是否可以用hashcode()方法,答案是不可以必須用equals()方法。兩個不同對象可能hashcode相等,但兩個不同hashcode的對象一定不同。
另一個注意的問題:設(shè)計一個類的時候為需要重寫equals方法,比如String類,但是千萬要注意,在重寫equals方法的同時,必須重寫hashCode方法。下面看一個只重寫了equals方法的例子:
import java.util.HashMap;import java.util.HashSet;import java.util.Set;
class People{
private String name;
private int age;
public People(String name,int age) {
this.name = name;
this.age = age;
}
public void setAge(int age){
this.age = age;
}
@Override
public boolean equals(Object obj) {
// TODO Auto-generated method stub
return this.name.equals(((People)obj).name) && this.age== ((People)obj).age;
}
}
public class Main {
public static void main(String[] args) {
People p1 = new People("Jack", 12);
System.out.println(p1.hashCode());
HashMap<People, Integer> hashMap = new HashMap<People, Integer>();
hashMap.put(p1, 1);
System.out.println(hashMap.get(new People("Jack", 12)));
}
}
如果兩個People對象,如果它的姓名和年齡相等,則認(rèn)為是同一個人。這段代碼本來的意愿是想這段代碼輸出結(jié)果為“1”,但是事實上它輸出的是“null”。
雖然通過重寫equals方法使得邏輯上姓名和年齡相同的兩個對象被判定為相等的對象(跟String類類似),但是要知道默認(rèn)情況下,hashCode方法是將對象的存儲地址進(jìn)行映射。那么上述代碼的輸出結(jié)果為“null”就不足為奇了。原因很簡單,p1指向的對象和System.out.println(hashMap.get(new People("Jack", 12)));這句中的new People("Jack", 12)生成的是兩個對象,它們的存儲地址肯定不同。所以在hashmap進(jìn)行get操作時,因為得到的hashcdoe值不同直接返回null。如果想上述代碼輸出結(jié)果為“1”,很簡單,只需要重寫hashCode方法,讓equals方法和hashCode方法始終在邏輯上保持一致性。
import java.util.HashMap;import java.util.HashSet;import java.util.Set;
class People{
private String name;
private int age;
public People(String name,int age) {
this.name = name;
this.age = age;
}
public void setAge(int age){
this.age = age;
}
@Override
public int hashCode() {
// TODO Auto-generated method stub
return name.hashCode()*37+age;
}
@Override
public boolean equals(Object obj) {
// TODO Auto-generated method stub
return this.name.equals(((People)obj).name) && this.age== ((People)obj).age;
}
}
public class Main {
public static void main(String[] args) {
People p1 = new People("Jack", 12);
System.out.println(p1.hashCode());
HashMap<People, Integer> hashMap = new HashMap<People, Integer>();
hashMap.put(p1, 1);
System.out.println(hashMap.get(new People("Jack", 12)));
}
}
下面引用一下Effective Java一書:
在程序執(zhí)行期間,只要equals方法的比較操作用到的信息沒有被修改,那么對這同一個對象調(diào)用多次,hashCode方法必須始終如一地返回同一個整數(shù)。
如果兩個對象根據(jù)equals方法比較是相等的,那么調(diào)用兩個對象的hashCode方法必須返回相同的整數(shù)結(jié)果。
如果兩個對象根據(jù)equals方法比較是不等的,則hashCode方法不一定得返回不同的整數(shù)。
對于第二條和第三條很好理解,但是第一條,很多時候就會忽略。在《Java編程思想》一書中的P495頁也有同第一條類似的一段話:
“設(shè)計hashCode()時最重要的因素就是:無論何時,對同一個對象調(diào)用hashCode()都應(yīng)該產(chǎn)生同樣的值。如果在講一個對象用put()添加進(jìn)HashMap時產(chǎn)生一個hashCdoe值,而用get()取出時卻產(chǎn)生了另一個hashCode值,那么就無法獲取該對象了。所以如果你的hashCode方法依賴于對象中易變的數(shù)據(jù),用戶就要當(dāng)心了,因為此數(shù)據(jù)發(fā)生變化時,hashCode()方法就會生成一個不同的散列碼”。
文章來自:開源中國/ws199358