🎗️ 博客新人,希望大家一起加油进步
🎗️ 乾坤未定,你我皆黑马
目录
- 1、搜索树("Tree")
- 1.1 概念
- 1.2 操作 - 查找
- 1.3 操作 - 插入
- 1.4 操作-删除(难点)
- 1.5 性能分析
- 2、搜索
- 2.1 概念及场景
- 2.2 模型
- 3. Map的使用
- 3.1 关于Map的说明
- 3.2 关于Map.Entry<K, V>的说明
- 3.3 Map 的常用方法说明
- 4. Set的说明
- 4.1 常见方法说明
我们首先来看一下集合的框架结构:
Set实现了Collection接口,Map是一个单独存在的接口。
而下面又分别各有两个类,分别是TreeSet(HashSet)和 HashSet(HashMap)
Map和Set的作用是用来查找和搜索的;以后涉及到查找和搜索的可以选择使用这两个接口下面具体的类。
搜索树(“Tree”)
1、搜索树(“Tree”)
1.1 概念
二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
- 若它的左子树不为空,则左子树上所有节点的值都小于根节点的值
- 若它的右子树不为空,则右子树上所有节点的值都大于根节点的值
- 它的左右子树也分别为二叉搜索树
如图所示:
1.2 操作 - 查找
思路如图:
- 代码实现
/**
* 查找二叉搜索树中指定的val值
*
* @param val
* @return
*/
public TreeNode find(int val) {
TreeNode cur = root;
// if(null == cur) {
// return null;
// }
while (cur != null) {
if (cur.val > val) {
cur = cur.right;
} else if (cur.val < val) {
cur = cur.left;
} else {
return cur;
}
}
return null;
}
1.3 操作 - 插入
- 如果树为空树,即根 == null,直接插入
- 如果树不是空树,按照查找逻辑确定插入位置,插入新节点
- 注意: 一般情况下是不插入相同的数据的
- 代码实现
/**
* 插入一个数据
*
* @param val
*/
public void insert2(int val) {
if (root == null) {
root = new TreeNode(val);
return;
}
TreeNode cur = root;
TreeNode parent = null;
while (cur != null) {
if(cur.val < val) {
parent = cur;
cur = cur.right;
}
if(cur.val > val) {
parent = cur;
cur = cur.left;
}
}
//走完之后判断前一个结点是否比val大
if(cur.val < val) {
//parent.right.val = val;
parent.right = new TreeNode(val);
}
if(cur.val > val) {
//parent.left.val = val;
parent.left = new TreeNode(val);
}
}
1.4 操作-删除(难点)
设待删除结点为 cur, 待删除结点的双亲结点为 parent
分为三种情况:
1. cur.left == null
- cur 是 root,则 root = cur.right
- cur 不是 root,cur 是 parent.left,则 parent.left = cur.right
- cur 不是 root,cur 是 parent.right,则 parent.right = cur.right
2. cur.right == null
- cur 是 root,则 root = cur.left
- cur 不是 root,cur 是 parent.left,则 parent.left = cur.left
- cur 不是 root,cur 是 parent.right,则 parent.right = cur.left
3. cur.left != null && cur.right != null
需要使用替换法进行删除,即在它的右子树中寻找中序下的第一个结点(关键码最小),用它的值填补到被删除节点中,再来处理该结点的删除问题
- 1.4.1 三种情况下也有具体要细分的:
- 待删除的左边为空 cur.left == null ,如图所示:
- 待删除的右边为空 cur.left == null ,如图所示:
- 待删除的节点左右边都不为空 .cur.left != null && cur.right != null ,如图所示:
思路:找到删除节点cur的右边节点中最小的值,替换到cur处,最后把替换到最后的一个节点给删除掉即可。
- 代码实现
/**
* 删除值为val的节点
* @param val
*/
//自己练习写的
public void remove(int val) {
TreeNode cur = root;
TreeNode parent = null; //用于记录cur的前一个节点
while(cur != null) {
if(cur.val == val) {
removeNode2(parent,cur);
return;
}else if(cur.val > val) {
parent = cur;
cur = cur.left;
}else {
parent = cur;
cur = cur.right;
}
}
}
//自己练习写的
private void removeNode2(TreeNode parent, TreeNode cur) {
//第一种情况 cur是root
if(cur.left == null) {
if(cur == root) {
root = cur.right; //此时cur所在节点是要删除的节点
return;
} else {
if(cur == parent.right) {
//第二种情况 cur不是root,cur是parent.right
parent.right = cur.right;
} else {
//第三种情况 cur不是root,cur是parent.left
parent.left = cur.right;
}
}
} else if(cur.right == null) {
if(cur == root) { //第一种情况 cur是root
root = cur.left; //此时cur所在节点是要删除的节点
return;
} else {
if(cur == parent.right) {
//第二种情况 cur不是root,cur是parent.right
parent.right = cur.left;
} else {
//第三种情况 cur不是root,cur是parent.left
parent.left = cur.left;
}
}
} else { //cur左右都不为空节点 思路:找到cur右边节点最小的值与之进行交换就可以了
TreeNode targetP = cur;
TreeNode target = cur.right;
while(target.left != null) {
targetP = target;
target = target.left;
}
//走到这说明target的左节点为空了
//进行交换
cur.val = target.val;
if(target == targetP.left) {
targetP.left = target.right; //target.right为空也没事,给到targetP.left,说明targetP节点左侧为空了
}
if(target == targetP.right) {
targetP.right = target.right; //这种情况是target没有左节点,相当于cur右边节点是个右单树
}
}
}
1.5 性能分析
- 插入和删除操作都必须先查找,查找效率代表了二叉搜索树中各个操作的性能。
- 对有n个结点的二叉搜索树,若每个元素查找的概率相等,则二叉搜索树平均查找长度是结点在二叉搜索树的深度的函数,即结点越深,则比较次数越多。
- 但对于同一个关键码集合,如果各关键码插入的次序不同,可能得到不同结构的二叉搜索树。
最优情况下,二叉搜索树为完全二叉树,其平均比较次数为:logN
最差情况下,二叉搜索树退化为单支树,其平均比较次数为:N/2
- TreeMap 和 TreeSet 即 java 中利用搜索树实现的 Map 和 Set;实际上用的是红黑树,而红黑树是一棵近似平衡的二叉搜索树,即在二叉搜索树的基础之上 + 颜色以及红黑树性质验证。
2、搜索
2.1 概念及场景
Map和set是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。以前常见的搜索方式有:
- 直接遍历,时间复杂度为O(N),元素如果比较多效率会非常慢
- 二分查找,时间复杂度为 ,但搜索前必须要求序列是有序的
上述排序比较适合静态类型的查找,即一般不会对区间进行插入和删除操作了,而现实中的查找比如: - 根据姓名查询考试成绩
- 通讯录,即根据姓名查询联系方式
- 不重复集合,即需要先搜索关键字是否已经在集合中可能在查找时进行一些插入和删除的操作,即动态查找,那上述两种方式就不太适合了,本节介绍的Map和Set是一种适合动态查找的集合容器。
2.2 模型
一般把搜索的数据称为关键字(Key),和关键字对应的称为值(Value),将其称之为Key-value的键值对,所以模型会有两种:
- 纯 key 模型,比如:
有一个英文词典,快速查找一个单词是否在词典中快速查找某个名字在不在通讯录中 - Key-Value 模型,比如:
统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数:<单词,单词出现的次数>
梁山好汉的江湖绰号:每个好汉都有自己的江湖绰号
而Map中存储的就是key-value的键值对,Set中只存储了Key。
3. Map的使用
3.1 关于Map的说明
Map是一个接口类,该类没有继承自Collection,该类中存储的是<K,V>结构的键值对,并且K一定是唯一的,不能重复。
3.2 关于Map.Entry<K, V>的说明
Map.Entry<K, V> 是Map内部实现的用来存放<key, value>键值对映射关系的内部类,该内部类中主要提供了<key, value>的获取,value的设置以及Key的比较方式。
方法 | 解释 |
K getKey() | 返回 entry 中的 key |
V getValue() | 返回 entry 中的 value |
V setValue(V value) | 将键值对中的value替换为指定value |
注意:Map.Entry<K,V>并没有提供设置Key的方法
3.3 Map 的常用方法说明
注意:
- Map是一个接口,不能直接实例化对象, 如果要实例化对象只能实例化其实现类TreeMap或者HashMap
- Map中存放键值对的Key是唯一的,value是可以重复的
- 在TreeMap中插入键值对时,key不能为空,否则就会抛NullPointerException异常,value可以为空。但是HashMap的key和value都可以为空。
- Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。
- Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。
- Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行重新插入。
- TreeMap和HashMap的区别如下图所示:
4. Set的说明
4.1 常见方法说明
方法 | 解释 |
boolean add(E e) | 添加元素,但重复元素不会被添加成功 |
void clear() | 清空集合 |
boolean contains(Object o) | 判断 o 是否在集合中 |
Iterator iterator() | 返回迭代器 |
boolean remove(Object o) | 删除集合中的 o |
int size() | 返回set中元素的个数 |
boolean isEmpty() | 检测set是否为空,空返回true,否则返回false |
Object[] toArray() | 将set中的元素转换为数组返回 |
boolean containsAll(Collection<?> c) | 集合c中的元素是否在set中全部存在,是返回true,否则返回false |
boolean addAll(Collection<? extendsE> c) | 将集合c中的元素添加到set中,可以达到去重的效果 |
注意:
- Set是继承自Collection的一个接口类
- Set中只存储了key,并且要求key一定要唯一
- TreeSet的底层是使用Map来实现的,其使用key与Object的一个默认对象作为键值对插入到Map中的
- Set最大的功能就是对集合中的元素进行去重
- 实现Set接口的常用类有TreeSet和HashSet,还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础
上维护了一个双向链表来记录元素的插入次序。- Set中的Key不能修改,如果要修改,先将原来的删除掉,然后再重新插入
- TreeSet中不能插入null的key,HashSet可以。
- TreeSet和HashSet的区别 如下图所示:
Set底层结构 | TreeSet | HashSet |
底层结构 | 红黑树 | 哈希桶 |
插入/删除/查找时间复杂度 | 0(Log N) | O(1) |
是否有序 | 关于Key有序 | 不一定有序 |
线程安全 | 不安全 | 不安全 |
插入/删除/查找区别 | 按照红黑树的特性来进行插入和删除 | 1. 先计算key哈希地址 2. 然后进行插入和删除 |
比较与覆写 | key必须能够比较,否则会抛出ClassCastException异常 | 自定义类型需要覆写equals和hashCode方法 |
应用场景 | 需要Key有序场景下 | Key是否有序不关心,需要更高的时间性能 |
解决下面的三个问题:
- 统计10W个数据当中,不重复的数据?(去重)
- 统计10W个数据当中,第一个重复的数据?
- 统计10W个数据当中,每个数据出现的次数?(对应的关系)
- 解题思路: 利用set可以达到去重的效果,出现的次数可以用到K - V 模型,即是map
- 代码实现
import java.util.*;
public class Test {
//1、统计10W个数据当中,不重复的数据?[去重]
public static void func1(int[] array) {
Set<Integer> set = new HashSet<>();
for (int i = 0; i < array.length; i++) {
set.add(array[i]);
}
System.out.println(set);
}
//2、统计10W个数据当中,第一个重复的数据?
public static void func2(int[] array) {
Set<Integer> set = new HashSet<>();
for (int i = 0; i < array.length; i++) {
if(!set.contains(array[i])) {
set.add(array[i]);
}else {
System.out.println(array[i]);
break;
}
}
}
//3、统计10W个数据当中,每个数据出现的次数? 对应的关系
public static void func3(int[] array) {
Map<Integer, Integer> map = new HashMap<>();
for (int i = 0; i < array.length; i++) {
int key = array[i];
if(map.get(key) == null) {
map.put(key, 1);
}else {
int val = map.get(key);
map.put(key, val+1);
}
}
//利用foreach语句 来遍历Map.Entry<K, V>导出的K-V 对应的关系来获取次数
for (Map.Entry<Integer, Integer> entry:map.entrySet()) {
System.out.println("key: "+ entry.getKey()+"出现了: "+entry.getValue()+" 次");
}
}
public static void main(String[] args) {
int[] array = new int[10_0000];
Random random = new Random();
for (int i = 0; i < array.length; i++) {
array[i] = random.nextInt(5_0000);
}
func1(array);
func2(array);
func3(array);
}
}
🎗️🎗️🎗️ 好啦,到这里我们的 Set 和 Map 的分享就没了,如果感觉做的还不错的可以点个赞,关注一下,你的支持就是我继续下去的动力,蟹蟹大家了,我们下期再见,拜拜~ ☆*: .。. o(≧▽≦)o .。.:*☆