当前位置:   article > 正文

c++数据结构:散列表(哈希)_开放定址法和链地址法的平均查找长度比较

开放定址法和链地址法的平均查找长度比较

记录的存储位置与关键字之间存在对应关系,对应关系———hash函数

Loc(i)=H(keyi)

假设散列函数为H(key)=k

数据为:1 2 5 8 9 6 7 

 访问的话可以通过下标来访问数据。

优缺点:

  • 查找效率高
  • 空间效率低

冲突: 不同的关键码映射到同一个散列地址,key≠key2,但H(key1)=H(key2)。

设关键码为(25 21 39 9 23 11)  H(k)=k%7 

由于H(k)=k%7 ,所以地址编号为0-6

H(25)=25%7=4    H(21)=21%7=0    H(39)=39%7=4    H(9)=9%7=2

H(23)=23%7=2    H(11)=11%7=4

同义词:具有相同函数值的多个关键词 

例如:上面的H(25 )H(39) H(11)具有相同的函数值

构造散列函数需要考虑的因素:

  • 执行速度
  • 关键词长度
  • 散列表大小
  • 关键词的分布情况
  • 查找频率

元素集合的构造特性:

  • n个数据原占用n个地址,希望散列表的地址空间尽可能小
  • 尽量均匀地存放元素,以避免冲突

构建方法:

  1. 直接定址法
  2. 数字分析法
  3. 平方取中法
  4. 折叠法
  5. 除留余数法
  6. 随机数法

直接定址法:

H(key)=key 或  a*key+b (a和b为常数)

优点:以关键码key的线性函数数值的散列地址,不会发生冲突。 

缺点:需要占用连续地址空间,空间效率低

除留余数法:

H(key)=key %  p   p<=表长

是最简单,也最常用的构造散列函数的方法,但关键的是得到p的值。

处理冲突的方法:

哈希函数可以减少冲突,但不能完全避免。

减少冲突的方法:

  1. 开放地址法
  2. 再哈希法
  3. 链地址法
  4. 建立一个公共溢出区

 一:开放定址法:

有冲突时就去寻找下一个空的散列地址,只要散列表足够强大,空的散列地址总能找到,并将元素存入。

Hi=(H(key)+d)% m  i=1,2,3,4...,k(k<=m-1) m为表长

 找空的散列地址的方法:

  • 线性探测法
  • 二次探测法
  • 伪随机探测法

线性探测法:

 Hi=(H(key)+d)% m    d为1,2,...,m-1  (m为散列表长度)

有冲突的话,就找到下一个地址,直到找到空地址存入

 二次谈探测法:

 Hi=(H(key)+d)% m    d为1^2,-1^2,2^2,-2^1,...,q^2  

有冲突的话,按照以上规则找到下一个地址,直到找到空地址存入

 伪随机法:

Hi=(H(key)+d)% m    d为一个随机数(1<=d<m)

二:链地址法:

相同散列地址的记录链成一单链表,m个散列地址就设m个单链表,用一个数组将m个单链表的表头指针存储起来,形成一个动态结构。

优缺点: 

  •  非同义词不会冲突,无聚集现象
  • 链表上节点空间动态申请,更适合于表长不确定的情况

三:再哈希法

Hi=RHi(key)     i=1,2,3,4,5,6,...k

RHi均是不同的哈希函数,即在同义词产生地址冲突时计算另一个哈希函数地址,直到冲突不再发生。不易发生聚集,但计算时间较长。 

四:建立一个公共溢出区 

创建一个溢出表来存放发生冲突的数据

哈希表的查找:

关键字为(19,14,23,1,68,20,84,27,55,11,10,79)

H(key)=key % 13    散列表m=16

线性探测再散列法:

链地址法 :

 平均查找长度的比较:

α=表中填入的记录数/哈希表长度

查找成功的平均查找长度:

 

查找成功的平均查找长度为:

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/552343
推荐阅读
相关标签
  

闽ICP备14008679号