赞
踩
在数据规模较大时,哈希表查找是最优的查找方式。理论上,哈希表的查找时间复杂度可以降为 O(1),即与数据规模无关。但是一般情况下,哈希查找的平均比较次数(ASL)并不会为1。这和哈希函数的定义和冲突解决机制密切相关。
首先给出查找信息结构体:
- struct Info
- {
- char name[30];
- char sex[3];
- char number[12];
- char college[30];
- };
数据示例:data.txt文件
格式:姓名 性别 手机号(查找关键字,根据需要修改) 学院
哈希表的空间有三种状态,空、被占用、被删除,一般只用前两种,这里给出三个状态的声明。以及哈希表的构建。关于哈希表的长度,笔者使用的数据量是2438,根据哈希表长规则,定义哈希表长度为2707。
- // 声明哈希表中每个元素的状态
- enum status { EMPTY, OCCUPIED, DELETED };
- typedef struct HashNode
- {
- Info info;
- enum status flag;
- } HashNode;
- // 构造哈希表
- HashNode hash_table[2707];
下面给出哈希函数的构造和冲突解决机制的构造,冲突解决机制采用线性探测。哈希函数和冲突解决机制可根据自身需要修改。
- // 定义哈希函数
- unsigned int hash_s(char number[12])
- {
- int p = 14;
- unsigned int hash_val = 0;
- for (int i = 0; i < strlen(number); i++)
- {
- hash_val = hash_val * p + number[i];
- }
- return hash_val % 2707; // 取模操作,控制哈希表大小
- }
- // 定义解决冲突的线性探测法
- int linear_probe(char number[12]) {
- unsigned int index = hash_s(number);
-
- int i = 0;
- while (hash_table[index].flag == OCCUPIED && strcmp(hash_table[index].info.number, number) != 0)
- {
- i++;
- index = (index + i) % 2707; // 按照线形探测顺序计
- }
-
- return index;
- }
哈希表插入函数和查找函数如下。
- // 插入哈希表元素
- void insert_hx(HashNode* hash_table, Info* info) {
- unsigned int index = hash_s(info->number);
- if (hash_table[index].flag == EMPTY || hash_table[index].flag == DELETED)
- {
- hash_table[index].info = *info;
- hash_table[index].flag = OCCUPIED;
- return;
- }
- index = linear_probe(info->number);
- hash_table[index].info = *info;
- hash_table[index].flag = OCCUPIED;
- }
- // 查找哈希表元素
- Info* find(HashNode* hash_table, char number[12])
- {
- unsigned int index = hash_s(number);
- int i=0;
- HXBJ_sum=0;
- while (hash_table[index].flag != EMPTY && i < 2707)
- {
- if (hash_table[index].flag == OCCUPIED && strcmp(hash_table[index].info.number, number) == 0)
- {
- HXBJ_sum++;
- return &(hash_table[index].info);
- }
- i++;
- index = (index + i) % 2707;
- HXBJ_sum++;
- }
- // 没有找到匹配的元素
- return NULL;
- }
代码如下:
- #include <stdio.h>
- #include <string.h>
- #include<stdlib.h>
- #include<iostream>
- using namespace std;
- int HXBJ_sum=0;
- #define N 2438
- struct Info
- {
- char name[30];
- char sex[3];
- char number[12];
- char college[30];
- };
-
- // 声明哈希表中每个元素的状态
- enum status { EMPTY, OCCUPIED, DELETED };
-
- typedef struct HashNode
- {
- Info info;
- enum status flag;
- } HashNode;
- // 构造哈希表
- HashNode hash_table[2707];
- // 定义哈希函数
- unsigned int hash_s(char number[12])
- {
- int p = 14;
- unsigned int hash_val = 0;
- for (int i = 0; i < strlen(number); i++)
- {
- hash_val = hash_val * p + number[i];
- }
- return hash_val % 2707; // 取模操作,控制哈希表大小
- }
- // 定义解决冲突的线性探测法
- int linear_probe(char number[12]) {
- unsigned int index = hash_s(number);
-
- int i = 0;
- while (hash_table[index].flag == OCCUPIED && strcmp(hash_table[index].info.number, number) != 0)
- {
- i++;
- index = (index + i) % 2707; // 按照线形探测顺序计
- }
-
- return index;
- }
- // 插入哈希表元素
- void insert_hx(HashNode* hash_table, Info* info) {
- unsigned int index = hash_s(info->number);
- if (hash_table[index].flag == EMPTY || hash_table[index].flag == DELETED)
- {
- hash_table[index].info = *info;
- hash_table[index].flag = OCCUPIED;
- return;
- }
- index = linear_probe(info->number);
- hash_table[index].info = *info;
- hash_table[index].flag = OCCUPIED;
- }
- // 查找哈希表元素
- Info* find(HashNode* hash_table, char number[12])
- {
- unsigned int index = hash_s(number);
- int i=0;
- HXBJ_sum=0;
- while (hash_table[index].flag != EMPTY && i < 2707)
- {
- if (hash_table[index].flag == OCCUPIED && strcmp(hash_table[index].info.number, number) == 0)
- {
- HXBJ_sum++;
- return &(hash_table[index].info);
- }
- i++;
- index = (index + i) % 2707;
- HXBJ_sum++;
- }
- // 没有找到匹配的元素
- return NULL;
- }
- // 主函数
- int main()
- {
- Info info;
- Info* result;
- float ZB_ASL,AVL_ASL,HX_ASL,sum=0;
- int max;
- char s[12]={'0'},c='Y'; //需要查找的元素
- Info *arr,*T;
- int i=0;
- FILE *fp,*fp1;
- arr=new Info[N];
- fp=fopen("data.txt","r");
- fp1=fopen("data.txt","r");
- if(!fp||!fp1)
- {
- printf("文件打开失败,程序结束!");
- exit(0);
- }
- while(!feof(fp))
- {
- fscanf(fp,"%s %s %s %s",arr[i].name,arr[i].sex,arr[i].number,arr[i].college);
- i++;
- }
- while (!feof(fp1)) //创建哈希表
- {
- fscanf(fp1, "%s %s %s %s", info.name, info.sex, info.number, info.college);
- if (strlen(info.number) == 0)
- continue;
- insert_hx(hash_table, &info);
- }
- max=0;
- for(i=0;i<N;i++)
- {
- result = find(hash_table, arr[i].number);
- sum=sum+HXBJ_sum;
- if(HXBJ_sum>max)
- {
- max=HXBJ_sum;
- }
- }
- HX_ASL=sum/N;
- printf("哈希查找最大比较次数:%d次\n",max);
- printf("\n哈希查找ASL:%f\n\n",HX_ASL);
- while(c!='#')
- {
- printf("输入要查找的手机号码:");
- fflush(stdin);
- scanf("%s",s);
- result = find(hash_table, s);
- if(result)
- {
- printf("电话号为 %s 是 %s.其信息如下:\n",s, result->name);
- printf("姓名\t性别\t电话号码\t学院\n");
- printf("\n%s\t%s\t%s\t%s\n",result->name,result->sex,result->number,result->college);
- printf("哈希查找共比较了%d次!\n\n",HXBJ_sum);
- }
- else
- {
- printf("\n电话号为%s的人没有找到.\n",s);
- printf("哈希查找共比较了%d次!\n\n",HXBJ_sum);
- }
- printf("是否继续查找(#结束查找):");
- fflush(stdin);
- c=getchar();
- HXBJ_sum=0;
- }
- fclose(fp);
- return 0;
- }
运行得到如下结果:
本文基于vs2010旗舰版编译器,使用其他编译器可能需要改动代码才可以运行,如果有错误,欢迎讨论。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。