赞
踩
unordered_map内部实现了一个哈希表(也叫散列表),通过把关键码值映射到Hash表中一个位置来访问记录。但其元素的排列顺序是无序的。哈希表最大的优点,就是把数据的存储和查找消耗的时间大大降低,查找的时间复杂度可达到O(1),其在海量数据处理中有着广泛应用;而代价仅仅是消耗比较多的内存。然而在当前可利用内存越来越多的情况下,用空间换时间的做法是值得的。另外,编码比较容易也是它的特点之一。
其基本原理是:使用一个下标范围比较大的数组来存储元素。可以设计一个函数(哈希函数,也叫做散列函数),使得每个元素的关键字都与一个函数值(即数组下标,hash值)相对应,于是用这个数组单元来存储这个元素;也可以简单的理解为,按照关键字为每一个元素“分类”,然后将这个元素存储在相应“类”所对应的地方,称为桶。
但是,不能够保证每个元素的关键字与函数值是一一对应的,因此极有可能出现对于不同的元素,却计算出了相同的函数值,这样就产生了“冲突”,换句话说,就是把不同的元素分在了相同的“类”之中。 总的来说,“直接定址”与“解决冲突”是哈希表的两大特点。
hash_map,首先分配一大片内存,形成许多桶。是利用hash函数,对key进行映射到不同区域(桶)进行保存。其插入过程是:
其取值过程是:
hash_map中直接地址用hash函数生成,解决冲突,用比较函数解决。这里可以看出,如果每个桶内部只有一个元素,那么查找的时候只有一次比较。当许多桶内没有值时,许多查询就会更快了(指查不到的时候). 由此可见,要实现哈希表, 和用户相关的是:hash函数和比较函数。这两个参数刚好是我们在使用hash_map时需要指定的参数。
哈希函数(hash function)的目的是根据给定对象算出一个哈希码(hash code),使得对象经过hash code映射之后能够乱且随机地被放置在哈希表(hashtable)中,从而尽量避免发生哈希碰撞。
举个例子
- #include <map>
- #include <unordered_map>
- #include <unordered_set>
- #include <iostream>
-
- using std::cout;
- using std::endl;
-
-
- class MyClass
- {
- public:
- MyClass():str("hello"), data(0) {}
-
- bool operator==(const MyClass& rhs) const{return (data == rhs.data) && (str == rhs.str); } //注意要重载这个==,
- //因为unordered_set或者unordered_map
- //中需要对元素是否相同进行判断
-
- public: //
- int data;
- std::string str;
- };
-
- //注意这里是将自己写的偏特化也同样加入到std中,因为他的模板是在std里面的,
- //具体形式可以自己简单查看一下源码中的实现形式
- //然后照着写一个自己的版本就行了。
- namespace std
- {
- template<>
- struct hash<MyClass>: public __hash_base<size_t, MyClass> //标准库中有这个继承,查看一下其实只是继承两个typedef而已,
- //所以不写这个继承在这个例子中也是可以运行的
- //但为了更好的使用这个hash,写上去会比较好
- {
- size_t operator()(const MyClass& rhs) const noexcept //这个const noexpect一定要写上去
- {
- return (std::hash<int>()(rhs.data)) ^ (std::hash<std::string>()(rhs.str) << 1); //当然,可以使用其他的方式来组合这个哈希值,
- //这里是cppreference里面的例子,产生的数够乱就行。
- }
- };
- }
-
-
- int main()
- {
- MyClass c;
- std::hash<MyClass> myHash; //创建一个函数对象
- std::cout << myHash(c) << std::endl;
-
- //注意这第三个参数是typename _Hash = hash < _Value >, 是可写可不写的,因为他是有默认形式的,写出来就是这样
- std::unordered_map<MyClass, char, std::hash<MyClass>> m; //这第三个参数
-
- std::unordered_set<MyClass> s; //和上面的是一个意思,第二个参数是typename _Hash = hash < _Value >,可写可不写, 这里我是没写的。
- s.insert(c);
- s.insert(c);
-
- std::cin.get();
- }
-
问题:求两数之和
利用unordered_map数组构造映射,遍历nums[i]时,看target-nums[i]是否存在hash表中即可。
时间复杂度O(n),空间复杂度O(n)
- class Solution4 {
- public:
- vector<int> twoSum(vector<int>& nums, int target) {
- vector<int> ans;
- unordered_map<int, int>hashmap;
- for (int i = 0; i < nums.size(); i++) {
- if (hashmap[target - nums[i]]
- && hashmap[target - nums[i]] != i + 1) {
- //防止利用同个元素
- ans.push_back(i);
- ans.push_back(hashmap[target - nums[i]] - 1);
- return ans;
- }
- hashmap[nums[i]] = i + 1;//将hash表对应下标+1,防止处理下标为0的情况
-
- }
-
- return ans;
- }
- };
参考:
C++ STL中哈希表 hash_map从头到尾详细介绍_yousss的博客-CSDN博客_std::hash_map
关于HashMap几个刁钻的面试题_砖家穴者叫兽的博客-CSDN博客_关于hashmap的几道面试题
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。