当前位置:   article > 正文

【 C++ 】用一个哈希表封装unordered_map和unordered_set

【 C++ 】用一个哈希表封装unordered_map和unordered_set

目录

1、哈希表源代码

2、哈希函数模板参数的控制

3、对上层容器构建仿函数便于后续映射

4、部分类型无法取模问题

5、哈希表底层迭代器的实现

        框架

        ++运算符重载

        != 和 == 运算符重载

        * 和 -> 运算符重载

6、哈希表的迭代器相关函数(begin和end)

7、哈希表的优化(素数表)

8、unordered_map的插入和[ ]运算符重载

9、封装后源代码

        哈希表源代码链接

        unordered_set的模拟实现源代码

        unordered_map的模拟实现源代码


1、哈希表源代码

根据先前对unordered_map和unordered_set的学习,我们得知其底层是借助哈希表来实现的,下面,我将用上篇博文实现的开散列哈希表来模拟实现unordered_map和unordered_set,哈希表源代码链接如下:

简化版哈希表

下面我将对哈希表进行改造,使其能够很好的封装unordered_map与unordered_set。


2、哈希函数模板参数的控制

我们都清楚unorderded_map是KV模型,而unordered_set是K模型,而先前实现的哈希表是写死的pair键值对的KV模型,很显然不适用_set模型,因此要实现一个泛型,这就需要我们对哈希表的模板参数进行控制

更改哈希节点的模板参数:

  • 这里我们把参数设为T,如果后续传入节点的类型为K模型,则T为K模型,若为pair键值对KV模型,则为KV模型,代码如下:
  1. template<class T>
  2. struct HashNode
  3. {
  4. T _data;
  5. HashNode<T>* _next;
  6. //构造函数
  7. HashNode(const T& data)
  8. :_data(data)
  9. , _next(nullptr)
  10. {}
  11. };

更改哈希表的模板参数:

  • 这里我们把第二个模板参数设为T,便于识别后续传入的数据类型
  1. //unordered_map -> HashTable<K, pair<K, V>> _ht;
  2. //unordered_set -> HashTable<K, K> _ht;
  3. template<class K, class T, class HashFunc = DefaultHash<K>>
  4. class HashTable

unordered_set的参数控制:

  • 如果上层使用的是unordered_set容器,那么哈希表的参数对应的就是K,K类型。
  1. template<class K>
  2. class unordered_set
  3. {
  4. private:
  5. Bucket::HashTable<K, K> _ht;
  6. };

unordered_map的参数控制:

  • 如果上层使用的是unordered_map容器,那么哈希表的参数对应的就是K,pair<K, V>类型。
  1. template<class K, class V>
  2. class unordered_map
  3. {
  4. private:
  5. Bucket::HashTable<K, pair<K, V>> _ht;
  6. };

3、对上层容器构建仿函数便于后续映射

在哈希映射的过程中,我们需要获得元素的键值,然后通过对应的哈希函数计算获得映射的地址,上一步为了适配_set和_map,我们对模板参数进行了整改,现在哈希节点存储的数据类型是T,T可能是一个键值,也可能是一个键值对,底层的哈希并不知道传入的数据是啥类型,因此我们需要对上层容器套一层仿函数来告诉底层哈希

unordered_set的仿函数:

  • 针对于unordered_set这种K类型的容器,我们直接返回key即可。
  1. template<class K>
  2. class unordered_set
  3. {
  4. //仿函数
  5. struct SetKeyOfT
  6. {
  7. const K& operator()(const K& key)
  8. {
  9. return key;
  10. }
  11. };
  12. private:
  13. Bucket::HashTable<K, K, SetKeyOfT> _ht;
  14. };

unordered_map的仿函数:

  • _map的数据类型是pair键值对,我们只需要取出其first第一个数据key然后返回即可。
  1. template<class K, class V>
  2. class unordered_map
  3. {
  4. //仿函数
  5. struct MapKeyOfT
  6. {
  7. const K& operator()(const pair<K, V>& kv)
  8. {
  9. return kv.first;
  10. }
  11. };
  12. private:
  13. Bucket::HashTable<K, pair<K, V>, MapKeyOfT> _ht;
  14. };

更改底层哈希的模板参数:

  • 上层容器的仿函数已经套好,下面需要整改下底层哈希的模板参数来接收上层容器的数据类型。
  1. //unordered_map -> HashTable<K, pair<K, V>, MapKeyOfT> _ht;
  2. //unordered_set -> HashTable<K, K, SetKeyOfT> _ht;
  3. template<class K, class T, class KeyOfT, class HashFunc = DefaultHash<K>>
  4. class HashTable

4、部分类型无法取模问题

现在,我们已经通过构建仿函数成功获得无论unordered_map还是unordered_set的key数据,但是这又存在一个问题,那就是建立映射关系时存在无法取模的问题,就比如说我现在有一个自定义类型的日期类,那么我传入的模板参数就是Date日期类:

  1. struct Date
  2. {
  3. Date(int year = 1, int month = 1, int day = 1)
  4. :_year(year)
  5. , _month(month)
  6. , _day(day)
  7. {}
  8. bool operator==(const Date& d) const
  9. {
  10. return _year == d._year
  11. && _month == d._month
  12. && _day == d._day;
  13. }
  14. int _year;
  15. int _month;
  16. int _day;
  17. };
  18. cpp::unordered_set<Date> sd;
  19. sd.insert(Date(2022, 3, 4));
  • 这里的key是自定义类型日期类Date,不能直接转化为整型,我们可以像之前那样整个特化,但是日期类不是常用的类,而且这也相当于是改库了,比较好的解决办法是显示的传一个仿函数来帮助我们解决取模问题。但是就要把放到哈希表这一层的仿函数挪到上层容器的模板参数那,整改后上层容器的模板参数如下:

unordered_set的模板参数:

  1. template<class K, class HashFunc = DefaultHash<K>>
  2. class unordered_set
  3. {
  4. //仿函数
  5. struct SetKeyOfT
  6. {
  7. const K& operator()(const K& key)
  8. {
  9. return key;
  10. }
  11. };
  12. public:
  13. //插入
  14. bool insert(const K& key)
  15. {
  16. return _ht.Insert(key);
  17. }
  18. private:
  19. Bucket::HashTable<K, K, SetKeyOfT, HashFunc> _ht;
  20. };

unordered_map的模板参数:

  1. template<class K, class V, class HashFunc = DefaultHash<K>>
  2. class unordered_map
  3. {
  4. //仿函数
  5. struct MapKeyOfT
  6. {
  7. const K& operator()(const pair<K, V>& kv)
  8. {
  9. return kv.first;
  10. }
  11. };
  12. public:
  13. //插入
  14. bool insert(const pair<K, V>& kv)
  15. {
  16. return _ht.Insert(kv);
  17. }
  18. private:
  19. Bucket::HashTable<K, pair<K, V>, MapKeyOfT, HashFunc> _ht;
  20. };

哈希表底层的模板参数:

  1. template<class K, class T, class KeyOfT, class HashFunc>
  2. class HashTable

更改了仿函数的设定方式后,我们就可以针对上述日期类单独写个仿函数并采用BKDRhash算法来帮助我们获取对应的整型,以此完成日期类的映射关系:

  1. struct DateHash
  2. {
  3. size_t operator()(const Date& d)
  4. {
  5. size_t hash = 0;
  6. hash += d._year;
  7. hash *= 131;
  8. hash += d._month;
  9. hash *= 1313;
  10. hash += d._day;
  11. return hash;
  12. }
  13. };
  14. cpp::unordered_set<Date, DateHash> sd;
  15. sd.insert(Date(2022, 3, 4));
  16. sd.insert(Date(2022, 4, 3));

建立映射关系后,调试窗口如下:


5、哈希表底层迭代器的实现

框架

这里的框架遵循两个关键点:

  1. 哈希表的正向迭代器实际上就是对哈希结点指针进行了封装,但是由于在实现++运算符重载时,需要在哈希表中去寻找下一个非空哈希桶,因此每一个正向迭代器中除了存放节点指针外,还都应该存储一个哈希表的地址。最后写个构造函数,初始化_node和_pht。
  2. 这里我们的迭代器的位置放在了哈希表(HashTable)的上面,而我迭代器内部又使用了HashTable,因为编译器是向上寻找,按照此位置摆放,迭代器的类里是找不到HashTable的,所以我们需要把HashTable的类在迭代器前面进行声明。
  1. //哈希表的声明
  2. template<class K, class T, class KeyOfT, class HashFunc>
  3. class HashTable;
  4. //正向迭代器
  5. template<class K, class T, class KeyOfT, class HashFunc>
  6. class __HTIterator
  7. {
  8. typedef HashNode<T> Node; //哈希节点的类型
  9. typedef __HTIterator<K, T, KeyOfT, HashFunc> Self; //正向迭代器的类型
  10. public:
  11. //构造函数
  12. __HTIterator(Node* node, HashTable<K, T, KeyOfT, HashFunc>* pht)
  13. :_node(node)
  14. , _pht(pht)
  15. {}
  16. //……
  17. Node* _node;//节点指针
  18. HashTable<K, T, KeyOfT, HashFunc>* _pht;//哈希表的地址
  19. };

++运算符重载

假设此时的哈希表结构如图所示:

注意这里是一个哈希桶结构,每一个桶都是一串单链表,在单个桶中,我们拿到头节点指针,可以挨个遍历++it走完全程,但是这是多串单链表,我们需要保证在一个桶走完后要到下一个桶去,因此在++运算符重载的设定上要按照如下规则:

  • 若当前结点不是当前哈希桶中的最后一个结点,则++后走到当前哈希桶的下一个结点。
  • 若当前结点是当前哈希桶的最后一个结点,则++后走到下一个非空哈希桶的第一个结点。
  1. //++运算符重载
  2. Self& operator++()
  3. {
  4. if (_node->_next)
  5. {
  6. _node = _node->_next;
  7. }
  8. else//当前桶已经走完,需要到下一个不为空的桶
  9. {
  10. KeyOfT kot;//取出key数据
  11. HashFunc hf;//转换成整型
  12. size_t hashi = hf(kot(_node->_data));
  13. for (; hashi < _pht->_tables.size(); ++hashi)
  14. {
  15. if (_pht->_tables[hashi])//更新节点指针到非空的桶
  16. {
  17. _node = _pht->_tables[hashi];
  18. break;
  19. }
  20. }
  21. //没有找到不为空的桶,用nullptr去做end标识
  22. if (hashi == _pht->_tables.size())
  23. {
  24. _node = nullptr;
  25. }
  26. }
  27. return *this;
  28. }

由于正向迭代器中++运算符重载函数在寻找下一个结点时,会访问哈希表中的成员变量_table,而_table成员变量是哈希表的私有成员,因此我们需要将正向迭代器类声明为哈希表类的友元

  1. template<class K, class T, class KeyOfT, class HashFunc>
  2. class HashTable
  3. {
  4. //把迭代器设为HashTable的友元
  5. template<class K, class T, class KeyOfT, class HashFunc>
  6. friend class __HTIterator;
  7. typedef HashNode<T> Node;//哈希结点类型
  8. public:
  9. //……
  10. }

!= 和 == 运算符重载

比较两迭代器是否相等,只需要判断两迭代器所封装的节点是否是同一个即可。

  1. //!=运算符重载
  2. bool operator!=(const Self& s) const
  3. {
  4. return _node != s._node;
  5. }
  6. //==运算符重载
  7. bool operator==(const Self& s) const
  8. {
  9. return _node == s._node;
  10. }

* 和 -> 运算符重载

  • *运算符返回的是哈希节点数据的引用
  • ->运算符返回的是哈希节点数据的地址
  1. //*运算符重载
  2. T& operator*()
  3. {
  4. return _node->_data;//返回哈希节点中数据的引用
  5. }
  6. //->运算符重载
  7. T* operator->()
  8. {
  9. return &(_node->_data);//返回哈希节点中数据的地址
  10. }

6、哈希表的迭代器相关函数(begin和end)

这里我们需要进行正向迭代器类型的typedef,需要注意的是,为了让外部能够使用typedef后的正向迭代器类型iterator,我们需要在public区域进行typedef

  1. template<class K, class T, class KeyOfT, class HashFunc>
  2. class HashTable
  3. {
  4. //把迭代器设为HashTable的友元
  5. template<class K, class T, class KeyOfT, class HashFunc>
  6. friend class __HTIterator;
  7. typedef HashNode<T> Node;//哈希结点类型
  8. public:
  9. typedef __HTIterator<K, T, KeyOfT, HashFunc> iterator;//正向迭代器的类型
  10. }
  • typedef之后,就可以实现begin()和end()的函数了。

begin():

  1. 遍历哈希表,返回第一个不为空的桶的第一个节点的迭代器位置,借助正向迭代器的构造函数完成,还得传this指针(哈希表的指针)
  2. 若遍历结束没找到,说明哈希表里没有一个是空,直接返回end()尾部的迭代器位置。
  1. //begin
  2. iterator begin()
  3. {
  4. for (size_t i = 0; i < _tables.size(); i++)
  5. {
  6. Node* cur = _tables[i];
  7. //找到第一个不为空的桶的节点位置
  8. if (cur)
  9. {
  10. return iterator(cur, this);
  11. }
  12. }
  13. return end();
  14. }

end():

  • 哈希表的end()直接返回迭代器的构造函数(节点指针为空,哈希表指针为this)即可。
  1. //end()
  2. iterator end()
  3. {
  4. return iterator(nullptr, this);
  5. }

7、哈希表的优化(素数表)

在除留余数法时,最好模一个素数,这样模完后不会那么容易出现哈希冲突的问题,因此我们可以专门写一个素数表来解决。

  1. //素数表
  2. size_t GetNextPrime(size_t prime)
  3. {
  4. const int PRIMECOUNT = 28;
  5. static const size_t primeList[PRIMECOUNT] =
  6. {
  7. 53ul, 97ul, 193ul, 389ul, 769ul,
  8. 1543ul, 3079ul, 6151ul, 12289ul, 24593ul,
  9. 49157ul, 98317ul, 196613ul, 393241ul, 786433ul,
  10. 1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul,
  11. 50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul,
  12. 1610612741ul, 3221225473ul, 4294967291ul
  13. };
  14. // 获取比prime大那一个素数
  15. size_t i = 0;
  16. for (; i < PRIMECOUNT; ++i)
  17. {
  18. if (primeList[i] > prime)
  19. return primeList[i];
  20. }
  21. return primeList[i];
  22. }

8、unordered_map的插入和[ ]运算符重载

insert插入:

  • unordered_map的数据类型是KV模型,其插入的是一个pair键值对,这里要区别于unordered_set,实现方式也有所区别。
  1. //插入
  2. pair<iterator, bool> insert(const pair<K, V>& kv)
  3. {
  4. return _ht.Insert(kv);
  5. }

[ ]运算符重载:

  1. 首先调用insert函数插入键值对返回迭代器ret
  2. 通过返回的迭代器ret调用元素值value
  1. //[]运算符重载
  2. V& operator[](const K& key)
  3. {
  4. pair<iterator, bool> ret = insert(make_pair(key, V()));
  5. return ret.first->second;
  6. }

9、封装后源代码

哈希表源代码链接

调整后的哈希表源代码链接:哈希表封装的unordered_map与unordered_set源代码


unordered_set的模拟实现源代码

封装好了底层哈希表,剩下的就是相当于是在套模板了,具体实现的功能有插入、删除、查找、迭代器……功能。

  1. #include"HashTable.h"
  2. namespace cpp
  3. {
  4. template<class K, class HashFunc = DefaultHash<K>>
  5. class unordered_set
  6. {
  7. //仿函数
  8. struct SetKeyOfT
  9. {
  10. const K& operator()(const K& key)
  11. {
  12. return key;
  13. }
  14. };
  15. public:
  16. //现在没有实例化,没办法到HashTable里面找iterator,所以typename就是告诉编译器这里是一个类型,实例化以后再去取
  17. typedef typename Bucket::HashTable<K, K, SetKeyOfT, HashFunc>::iterator iterator;
  18. //begin()
  19. iterator begin()
  20. {
  21. return _ht.begin();
  22. }
  23. //end()
  24. iterator end()
  25. {
  26. return _ht.end();
  27. }
  28. //insert插入
  29. pair<iterator, bool> insert(const K& key)
  30. {
  31. return _ht.Insert(key);
  32. }
  33. //find查找
  34. iterator find(const K& key)
  35. {
  36. return _ht.Find(key);
  37. }
  38. //erase删除
  39. bool erase(const K& key)
  40. {
  41. return _ht.Erase(key);
  42. }
  43. private:
  44. Bucket::HashTable<K, K, SetKeyOfT, HashFunc> _ht;
  45. };
  46. }

unordered_map的模拟实现源代码

实现unordered_map的各个接口时,也是调用底层哈希表对应的接口就行了,此外还需要实现[]运算符的重载。

  1. #include"HashTable.h"
  2. namespace cpp
  3. {
  4. template<class K, class V, class HashFunc = DefaultHash<K>>
  5. class unordered_map
  6. {
  7. //仿函数
  8. struct MapKeyOfT
  9. {
  10. const K& operator()(const pair<K, V>& kv)
  11. {
  12. return kv.first;
  13. }
  14. };
  15. public:
  16. //现在没有实例化,没办法到HashTable里面找iterator,所以typename就是告诉编译器这里是一个类型,实例化以后再去取
  17. typedef typename Bucket::HashTable<K, pair<K, V>, MapKeyOfT, HashFunc>::iterator iterator;
  18. //begin()
  19. iterator begin()
  20. {
  21. return _ht.begin();
  22. }
  23. //end()
  24. iterator end()
  25. {
  26. return _ht.end();
  27. }
  28. //插入
  29. pair<iterator, bool> insert(const pair<K, V>& kv)
  30. {
  31. return _ht.Insert(kv);
  32. }
  33. //[]运算符重载
  34. V& operator[](const K& key)
  35. {
  36. pair<iterator, bool> ret = insert(make_pair(key, V()));
  37. return ret.first->second;
  38. }
  39. //find查找
  40. iterator find(const K& key)
  41. {
  42. return _ht.Find(key);
  43. }
  44. //erase删除
  45. bool erase(const K& key)
  46. {
  47. return _ht.Erase(key);
  48. }
  49. private:
  50. Bucket::HashTable<K, pair<K, V>, MapKeyOfT, HashFunc> _ht;
  51. };
  52. }
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/神奇cpp/article/detail/955632
推荐阅读
相关标签
  

闽ICP备14008679号