Python数据结构：哈希表_python3 哈希表

作者：天景科技苑 | 2024-07-12 01:12:40

踩

python3 哈希表

哈希

散列（哈希）是电脑科学中一种对资料的处理方法，通过某种特定的函数/算法（称为散列函数/算法）将要检索的项与用来检索的索引（称为散列，或者散列值）关联起来，生成一种便于搜索的数据结构（称为散列表）。

哈希表是什么

哈希表（散列表）是根据键（Key）直接访问内存存储位置的数据结构。根据键（Key）值将数据映射到内存中一个位置的函数称为哈希函数，根据哈希函数建立的记录数据的表称为哈希表。

哈希表的特点

若关键字为，则其值存放在的存储位置上。由此，不需比较便可直接取得所查记录。称这个对应关系为散列函数，按这个思想建立的表为散列表。
对不同的关键字可能得到同一散列地址，即，而，这种现象称为冲突。
若对于关键字集合中的任一个关键字，经散列函数映象到地址集合中任何一个地址的概率是相等的，则称此类散列函数为均匀散列函数（Uniform Hash function），这就是使关键字经过散列函数得到一个“随机的地址”，从而减少冲突。
微信搜索公众号：架构师指南，回复：架构师领取资料。

处理冲突

开放定址法

开放定址法就是产生冲突之后去寻找下一个空闲的空间。函数定义为：

其中，hash(key) 是哈希函数，是增量序列，为已冲突的次数。

线性探测法：，或者其他线性函数。相当于逐个探测存放地址的表，直到查找到一个空单元，然后放置在该单元。
平方探测法：

链表法

这是另外一种类型解决冲突的办法，散列到同一位置的元素，不是继续往下探测，而是在这个位置是一个链表，这些元素则都放到这一个链表上。

再散列

如果一次不够，就再来一次，直到冲突不再发生。

建立公共溢出区

将哈希表分为基本表和溢出表两部分，凡是和基本表发生冲突的元素，一律填入溢出表(注意：在这个方法里面是把元素分开两个表来存储)。

哈希表的应用

查字典
网络防火墙中，根据源IP，目的IP，源端口，目的端口，协议号构成的五元组来标识一条网络数据流的，并且根据五元组来建立会话表项(session entry)。为了查找便捷，一般都使用Hash表来实现这个会话表，以提高转发的效率。
Linux 内核大量采用哈希表

下面用开放地址法（线性探测）实现了一个简单的哈希表。仔细阅读后试试哈希表的各种操作，感受以下哈希表飞一般的速度吧！

代码段 1

class Hash:  
    # 表的长度定位11  
    def __init__(self):  
        self.hash_table=[[None,None]for i in range(11)]  
      
    # 散列函数  
    def hash(self,k,i):  
        h_value=(k+i)%11  
        if self.hash_table[h_value][0]==k:  
            return h_value  
        if self.hash_table[h_value][0]!=None:  
            i+=1  
            h_value=self.hash(k,i)  
        return h_value  
      
    def put(self,k,v):  
        hash_v=self.hash(k,0)  
        self.hash_table[hash_v][0]=k  
        self.hash_table[hash_v][1]=v  
  
    def get(self,k):  
  
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/天景科技苑/article/detail/812173