1 HashSet概述

特点:作为Set集合的一种,首先是无序的,不可重复的;允许存放null值;底层封装HashMap;实现是不同步的,线程不安全;

常用构造:

public HashSet() :构造一个新的空 set,其底层 HashMap 实例的默认初始容量是 16,加载因子是 0.75。

常用方法:

1)添加功能

boolean add(E e) : 如果此 set 中尚未包含指定元素,则添加指定元素

2)判断功能

boolean isEmpty(): 如果此 set 不包含任何元素,则返回 true。

boolean contains(Object o): 如果此列表中包含指定的元素,则返回 true

3)获取功能

int size() : 返回此 set 中的元素的数量(set 的容量)。

4)删除功能

void clear() :移除此列表中的所有元素。注意:此方法比较暴力,一般不使用。

boolean remove(Object o):如果指定元素存在于此 set 中,则将其移除。

5)迭代器功能

public Iteratoriterator() 返回对此 set 中元素进行迭代的迭代器。返回元素的顺序并不是特定的。

2 HashSet的使用

1)使用HashSet存储字符串:如何实现存储元素的唯一性??

  1. package SetTest;


  2. import java.util.HashSet;

  3. import java.util.Set;


  4. public class HashSetDemo1 {

  5.   public static void main(String[] args) {

  6.     Set<String> set = new HashSet<String>();

  7.     set.add("java");

  8.     set.add("js");

  9.     set.add("sql");

  10.     set.add("java");

  11.     set.add("js");

  12.     set.add("jquery");


  13.     for(String s:set){

  14.       System.out.println(s);

  15.     }

  16.   }

  17. }

输出结果:

javajsjquerysql

分析:

1)通过查看add()方法的源码,底层是使用HashMap的put()方法实现元素的存取,继续查看put存储元素的源码,可知要保证存储元素的唯一性依赖于元素的equals和hashCode方法的实现,首先看hashCode方法,如果存在hash值和待存储元素的hash值相等的元素,则继续通过equals方法比较二者。如果相等则不存储。

2)由于String类重写了equals()和hashCode()方法: 这两个方法都是依赖于String对象的内容》》只有字符串内容一样就认为是相等的,不会在集合中存储。

  1. public int hashCode() {

  2.   int h = hash;

  3.   if (h == 0 && value.length > 0) {

  4.     char val[] = value;


  5.     for (int i = 0; i < value.length; i++) {

  6.       h = 31 * h + val[i];   //hash值的生成依赖于字符串的内容

  7.     }

  8.     hash = h;

  9.   }

  10.   return h;

  11. }


  12. public boolean equals(Object anObject) {

  13.   if (this == anObject) {

  14.     return true;

  15.   }

  16.   if (anObject instanceof String) {

  17.     String anotherString = (String)anObject;

  18.     int n = value.length;

  19.     if (n == anotherString.value.length) {

  20.       char v1[] = value;

  21.       char v2[] = anotherString.value;

  22.       int i = 0;

  23.       while (n-- != 0) {    //判断两个字符串是否相等,依赖于字符串的内容是否一样

  24.         if (v1[i] != v2[i])

  25.           return false;

  26.         i++;

  27.       }

  28.       return true;

  29.     }

  30.   }

  31.   return false;

  32. }

同样在存储其他基本类型的装箱类型也可以实现存储元素的唯一性,因为这些装箱类型也实现了equals()和hashCode()方法。(如Integer,Character等)

2)使用HashSet存储自定义对象:如何保证存储元素的唯一性(此处我们认为Student的name和age相等就意味着元素相等)

  1. package SetTest;


  2. public class Student {

  3.   private String name;

  4.   private int age;

  5.   public Student(String name,int age){

  6.     this.name = name;

  7.     this.age = age;

  8.   }


  9.   public String getName() {

  10.     return name;

  11.   }


  12.   public void setName(String name) {

  13.     this.name = name;

  14.   }


  15.   public int getAge() {

  16.     return age;

  17.   }


  18.   public void setAge(int age) {

  19.     this.age = age;

  20.   }

  21.   @Override

  22.   public String toString() {

  23.     return "Student [name=" + name + ", age=" + age + "]";

  24.   }


  25.   @Override

  26.   public int hashCode() {

  27.     int hash = name.hashCode()+age;

  28.     return hash;

  29.   }

  30.   @Override

  31.   public boolean equals(Object obj) {

  32.     if(this==obj)

  33.       return true;

  34.     if(obj instanceof Student){

  35.       Student stu = (Student)obj;

  36.       if(stu.getName().equals(name) && stu.getAge()==age)

  37.         return true;

  38.     }

  39.     return false;

  40.   }

  41. }

  1. package SetTest;


  2. import java.util.HashSet;

  3. import java.util.Set;


  4. public class HashSetTest {

  5.   public static void main(String[] args) {

  6.     Set<Student> set = new HashSet<Student>();


  7.     Student stu1 = new Student("hu",12);

  8.     Student stu2 = new Student("wen",27);

  9.     Student stu3 = new Student("rt",12);

  10.     Student stu4 = new Student("you",15);

  11.     Student stu5 = new Student("hu",12);

  12.     Student stu6 = new Student("te",17);

  13.     Student stu7 = new Student("wen",27);


  14.     set.add(stu1);

  15.     set.add(stu2);

  16.     set.add(stu3);

  17.     set.add(stu4);

  18.     set.add(stu5);

  19.     set.add(stu6);

  20.     set.add(stu7);


  21.     for(Student s:set){

  22.       System.out.println(s.getName()+"------"+s.getAge());

  23.     }

  24.   }

  25. }

输出结果:

te------17hu------12wen------27rt------12you------15

分析:

从输出结果可知,此集合的存储保证了元素的唯一性,主要是因为我们在自定义类中重写了equals和hashCode方法。

总结:

要想在hashSet集合中实现元素存取的唯一性,由于底层判断依赖于equals和hashCode方法,故所存取的元素需要重写这两个方法,以按照我们的期待存取元素。保证元素唯一性。

重新强调下:

hashCode和equals方法的使用概念非常重要:不仅可以用于set还可以用于map。1)使用java系统类,如String/Date/或者数字包装类(Integer/Float),不必重写hashCode和equals方法。2)如果要在set或者map中添加自定义类的实例,就要确保equals和hashCode方法能正常工作,否则代码可能出现无法预料的结果

HashSet和其子类LinkedHashSet的区别:

简单的例子:

  1. HashSet<Student> set1 = new HashSet<Student>();

  2. Student stu1 = new Student("wen",12);

  3. Student stu2 = new Student("di",15);

  4. Student stu3 = new Student("wu",13);

  5. Student stu4 = new Student("yy",14);

  6. Student stu5 = new Student("fr",16);

  7. Student stu6 = new Student("vc",11);

  8. Student stu7 = new Student("aw",10);


  9. set1.add(stu1);

  10. set1.add(stu2);

  11. set1.add(stu3);

  12. set1.add(stu4);

  13. set1.add(stu5);

  14. set1.add(stu6);

  15. set1.add(stu7);

  16. System.out.println("-----------------HashSet----------------------");

  17. for(Student stu:set1){

  18.   System.out.println(stu.getName()+"-----------"+stu.getAge());

  19. }


  20. System.out.println("-----------------LinkedHashSet----------------------");

  21. LinkedHashSet<Student> set2 = new LinkedHashSet<Student>();

  22. set2.add(stu1);

  23. set2.add(stu2);

  24. set2.add(stu3);

  25. set2.add(stu4);

  26. set2.add(stu5);

  27. set2.add(stu6);

  28. set2.add(stu7);

  29. for(Student stu:set2){

  30.   System.out.println(stu.getName()+"-----------"+stu.getAge());

  31. }

输出结果是:

-----------------HashSet----------------------wu-----------13yy-----------14vc-----------11wen-----------12di-----------15fr-----------16aw-----------10-----------------LinkedHashSet----------------------wen-----------12di-----------15wu-----------13yy-----------14fr-----------16vc-----------11aw-----------10

LinkedHashSet的功能与HashSet类似,毕竟是其子类。

有一个重要的区别:LinkedHashSet返回的元素顺序是可以预测的,即元素添加到集合的顺序。该功能可以用来快速查找并判断集合中是否包含指定对象,或者用于检索元素并按照元素的添加顺序返回元素。