数据的方法,它用一种算法建立键值与真实值之间的对应关系,可以快速查找诸如链表中的元素。
数学表述为:h = H(M) ,其中H( )--单向散列函数,M--任意长度明文,h--固定长度散列值。
链表查找的时间效率为O(N),二分法为log2N,B+ Tree为log2N,但Hash链表查找的时间效率为O(1)。
Hash算法现在应用比较广泛,除了快速查找,负载均衡、安全领域都有使用。
Hash算法的衡量标准在不同的应用场景中有不同的衡量标准。大概有以下几种,但不仅限于此。
1. 抗冲突性(collision-resistant)
即在hash后无法产生2个散列值相同的预映射。通俗点讲不同的输入不能出现相同的输出。但绝对无冲突的hash算法很难做到。有些情形下为了防止hash冲突会进行二次hash或更多次的hash叠加。
单调性(Monotonicity)
hash表扩容或减少时,之前的结果不能发生太大的改变。
平衡性(Balance)
散列在不同区间上的预映射总数大致相当。
4.效率
要基本达到平均为O(1)的时间复杂度。