折半查找法又称为二分查找法。
#一、基本思想
假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。
重复以上过程,直到找到满足条件的记录,此时查找成功;或直到子表不存在为止,此时查找不成功。
#二、时间复杂度
二分查找的基本思想是将n个元素分成大致相等的两部分,取a[n/2]与x做比较,如果x=a[n/2],则找到x,算法中止;如果x<a[n/2],则只要在数组a的左半部分继续搜索x,如果x>a[n/2],则只要在数组a的右半部搜索x。
时间复杂度就是求while循环的次数。
假设总共有n个元素,每次查找的区间大小就是n,n/2,n/4,…,n/2^k,其中k就是循环的次数。
由于n/2^k
取整后>=1,令n/2^k=1
, 可得k=log2(n),(以2为底n的对数)。
所以时间复杂度可以表示为O(h)=O(log2(n))
#三、优缺点
优点是比较次数少,查找速度快,平均性能好;
缺点是要求待查表为有序表,且插入删除困难。
因此,折半查找方法适用于不经常变动而查找频繁的有序列表。
#四、C++实现
运行结果:
#五、分析:
(一)为何需要向下取整或向上取整呢?
当数组里的元素数量为奇数时,中间那个元素是固定的。
当数组里的元素数量为偶数时,中间有两个元素,向下取整就是取左边的那个数,向上取整就是取右边的那个数。比如 a[] = {1, 2, 3, 4, 5, 6},3和4都是中间元素,向下取整得到的是3,向上取整得到的是4。
(二)while里要不要加等号
- 对于bin_search函数,等号是一定要加的
例1:
a[] = {10, 20, 30, 40, 50, 60}, key = 20,low = 0, high = 5,
第一次循环, mid = (0 + 5) / 2 = 2, a[mid] > key, high = mid - 1 = 1
第二次循环,mid = (0 + 1) / 2 = 0, a[mid] < key, low = mid + 1 = 1
假如没有等号,即while(low < high),那么就不能再循环了,得不到正确的结果。
加了等号之后,即while(low <= high),
第三次循环,mid = (1 + 1) / 2 = 1,a[mid] = key,返回下标1。程序结束。 - 对于bin_search_1与bin_search_2函数,等号是一定不能加的
以bin_search_1为例,一旦加了等号之后,执行到low = high时, mid = low + (high - low) >> 1 = low
执行else语句,high = mid = low,陷入死循环。
bin_search_2与bin_search_1道理一样,不能加等号
- bin_search_1与bin_search_2在while结束后,为何还要用if再判断一次?
以bin_search_1为例,while循环结束后,有两种情况:要么a[high] = a[mid] = key, 要么a[high] = a[mid] > key。所以还要判断a[high]是否与key相等。
例2:
a[ ] = {10, 20, 30, 40, 50, 60}, key = 50,最终high = mid = 4, a[high] = key
例3:
a[ ] = {10, 20, 30, 40, 50, 60}, key = 45,最终high = mid = 4, a[high] > key
bin_search_2同理。
4 为何bin_search_1里,low = mid + 1, high = mid?
因为 a[mid] < key,说明key一定处于[mid + 1]和high之间。
反过来则是 a[mid] >= key。则key一定处于位置 low和mid之间。
bin_search_2中同理。