- 顺序查找
- 折半查找
- 算法描述
- 折半查找性能分析
查找的基本概念
- 查找表:由同一类型的数据元素(或记录)构成的集合
- 静态查找表:查找的同时对查找表不做修改操作(如插入和删除)
- 动态查找表:查找的同时对查找表具有修改操作
- 关键字:记录中某个数据项的值,可用来识别一个记录
- 主关键字:唯一标识数据元素
- 次关键字:可以标识若干个数据元素
查找算法的评价指标
- 关键字的平均比较次数,也称平均搜索长度ASL(Average Search Length)
- n:记录的个数
pi:查找第i个记录的概率 ( 通常认为pi =1/n )
ci:找到第i个记录所需的比较次数
线性表的查找
顺序查找
- 应用范围:顺序表或线性链表表示的静态查找表表内元素之间无序
- 结构定义
- 顺序查找值为key的元素
- 改进,加入“哨兵”
顺序查找的性能分析
- 空间复杂度:一个辅助空间
- 时间复杂度:
- 查找成功时的平均查找长度
设表中各记录查找概率相等
ASLs(n)=(1+2+ … +n)/n =(n+1)/2 - 查找不成功时的平均查找长度ASLf =n+1
顺序查找算法特点
- 算法简单,对表结构无任何要求(顺序和链式)
- n很大时查找效率较低
- 改进措施:非等概率查找时,可按照查找概率进行排序。
查找概率相等时,ASL相同;
查找概率不等时,如果从前向后查找,则按查找概率由大到小排列的有序表其ASL要比无序表ASL小
折半查找
若k==R[mid].key,查找成功
若k<R[mid].key,则high=mid-1
若k>R[mid].key,则low=mid+1
直至low>high时,查找失败
- 设表长为n,low、high和mid分别指向待查元素所在区间的上界、下界和中点,k为给定值
- 初始时,令low=1,high=n,mid=(low+high)/2
- 让k与mid指向的记录比较
- 若k==R[mid].key,查找成功
- 若k<R[mid].key,则high=mid-1
- 若k>R[mid].key,则low=mid+1
- 重复上述操作,直至low>high时,查找失败
算法描述
折半查找性能分析
- 查找成功时比较次数:为该结点在判定树上的层次数,不超过树的深度 d = log2 n + 1 (log向下取整)
- 查找不成功的过程就是走了一条从根结点到外部结点的路径d或d-1。
- 查找过程:每次将待查记录所在区间缩小一半,比顺序查找效率高,时间复杂度O(log2 n)
- 适用条件:采用顺序存储结构的有序表,不宜用于链式结构
分块查找(块间有序,块内无序)
- 分块有序,即分成若干子表,要求每个子表中的数值都比后一块中数值小(但子表内部未必有序)
- 然后将各子表中的最大关键字构成一个索引表,表中还要包含每个子表的起始地址(即头指针)。
- 分块查找过程
- 对索引表使用折半查找法(因为索引表是有序表)
- 确定了待查关键字所在的子表后,在子表内采用顺序查找法(因为各子表内部是无序表
分块查找性能分析
- 查找效率:ASL = Lb + Lw
- Lb::对索引表查找的ASL
- Lw:对块内查找的ASL
- ASL(bs): = log2 (n/s+1)+s/2 (log2 n <= ASL(bs) <= n(n+1)/2)
- 例如,当n=9,s=3时,ASL(bs)=3.5, 而折半法为 3.1, 顺序法为 5
分块查找优缺点
- 优点:插入和删除比较容易,无需进行大量移动。
- 缺点:要增加一个索引表的存储空间并对初始索引表进行排序运算。
- 适用情况:如果线性表既要快速查找又经常动态变化,则可采用分块查找。