数据的方法,它用一种算法建立键值与真实值之间的对应关系,可以快速查找诸如链表中的元素。

         数学表述为:h = H(M) ,其中H( )--单向散列函数,M--任意长度明文,h--固定长度散列值。 

         链表查找的时间效率为O(N),二分法为log2N,B+ Tree为log2N,但Hash链表查找的时间效率为O(1)。

         Hash算法现在应用比较广泛,除了快速查找,负载均衡、安全领域都有使用。

         Hash算法的衡量标准在不同的应用场景中有不同的衡量标准。大概有以下几种,但不仅限于此。

        1. 抗冲突性(collision-resistant)

         即在hash后无法产生2个散列值相同的预映射。通俗点讲不同的输入不能出现相同的输出。但绝对无冲突的hash算法很难做到。有些情形下为了防止hash冲突会进行二次hash或更多次的hash叠加。

单调性(Monotonicity)

     hash表扩容或减少时,之前的结果不能发生太大的改变。

平衡性(Balance)

         散列在不同区间上的预映射总数大致相当。

        4.效率

         要基本达到平均为O(1)的时间复杂度。