本文共 5415 字,大约阅读时间需要 18 分钟。
(Hash table,也叫),是根据关键码值(Key value)而直接进行访问的。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做,存放记录的叫做。
给定表M,存在函数Hash(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数Hash(key)为哈希(Hash) 函数。
构造哈希表的两种方法
1. 直接定址法:
取关键字的某个线性函数为散列地址,Hash(Key)=Key 或 Hash(Key)= A*Key+B。
利用数组下标可以很好的将对应的数据存入哈希表对应的位置。例如:在一个字符串中找出第一次只出现一次的字符,字符串为abcdabcdefg,需要找到e,利用下标统计可以很好地解决这个问题,对于这个问题,你必须开辟对应的256个空间。如果需要查找的数中出现了一个特别大的数(1000000),你必须要开辟1000000个空间,会造成大量空间的浪费。
2. 除留余数法:
取关键值被某个不大于散列表长m的数p除后的所得的余数为散列地址。Hash(Key)= Key % P。
由于“直接定址法”的缺陷,于是下面引入“除留余数法”,该方法提高的空间的利用率,但不同的Key值经过哈希函数Hash(Key)处理以后可能产生相同的值哈希地址,我们称这种情况为哈希冲突。任意的散列函数都不能避免产生冲突。
下面介绍处理哈希冲突的闭散列方法
1、线性探测
2、二次探测(二次方探测)
下面进行线性探测和二次探测来处理哈希冲突
要使程序可以处理基本类型数据,也可以进行非基本类型的处理,可通过仿函数实现
enum Status//设置状态的数组{ EXIST, DELETE, EMPTY,};templatestruct KeyValue//字典{ K _key; V _value; KeyValue(const K& key = K(), const V& value = V())//设置K()和V()为了无参初始化 :_key(key) , _value(value) {}};//针对string类型,仿函数实现template struct DefaultHashFuncer//基本类型{ size_t operator()(const K& key) { return key; }};static size_t BKDRHash(const char * str)//字符串哈希算法{ unsigned int seed = 131; // 31 131 1313 13131 131313 unsigned int hash = 0; while (*str) { hash = hash * seed + (unsigned int)(*str++); } return (hash & 0x7FFFFFFF);}template<>struct DefaultHashFuncer //string类型--模板的特化{ size_t operator()(const string& str) { return BKDRHash(str.c_str()); }};template >class HashTable{ typedef KeyValue KV;public://进行各函数的实现--进行增删查改private: KV* _table;//存放哈希数 Status* _status;//存放状态的数组 size_t _size;//哈希表中哈希数的个数 size_t _capacity;//哈希表的大小};
具体实现代码如下:
template>HashTable ::HashTable():_table(NULL), _status(NULL), _size(0), _capacity(0){}template >HashTable ::HashTable(size_t size):_table(new KV[size]), _status(new Status[size]), _size(0), _capacity(size){//不能用memset进行初始化(枚举类型不能用memset) for (size_t i = 0; i < _capacity; i++) { _status[i] = EMPTY;//状态数据初始化为EMPTY }}template >HashTable ::~HashTable(){ if (_table) { delete[] _table; delete[] _status; _size = 0; _capacity = 0; }}template >bool HashTable ::Insert(const K& key, const V& value)//防止冗余用bool{ CheckCapacity(_size + 1);//检查容量,不足增容 线性探测 //size_t index = HashFunc(key); //while (_status[index] == EXIST)//如果不为EMPTY或DELETE就不能在此位置处存入key,存在哈希冲突 //{ // if (_table[index]._key == key && _table[index]._value == value)//如果key已存在,就插入失败 // { // return false; // } // ++index; // if (index == _capacity)//如果哈希到了数组最后一位,就返回到第一位进行哈希 // { // index = 0; // } //} //++_size; //_table[index]._key = key; //_table[index]._value = value; //_status[index] = EXIST; //return true; //二次探测 size_t i = 0; size_t index = HashFunc0(key); while (_status[index] == EXIST)//如果不为EMPTY或DELETE就不能在此位置处存入key,存在哈希冲突 { if (_table[index]._key == key && _table[index]._value == value)//如果key已存在,就插入失败 { return false; } index = HashFunci(index, ++i); if (index >= _capacity)//如果哈希到的位置超过了数组最后一位,就从首位开始求出对应位置 { index = index - _capacity; } } _table[index]._key = key; _table[index]._value = value; _status[index] = EXIST; _size++; return true;;}template >size_t HashTable ::HashFunc(const K& key)//求出key在哈希表中的位置{ HashFuncer hp; return hp(key)%_capacity;//hp(key)调用仿函数}template >size_t HashTable ::HashFunc0(const K& key){ return HashFunc(key);//调用HashFunc函数,找到二次探测最初的位置}template >size_t HashTable ::HashFunci(size_t index, size_t i){ return index + (2 * i - 1);//优化后的算法}template >void HashTable ::CheckCapacity(size_t size)//注意载荷因子a控制在0.7到0.8之间{ if (size*10 > _capacity*7)//不用*0.7,由于定义的为size_t类型 { HashTable tmp(2 * _capacity); for (size_t index = 0; index < _capacity; index++) { if (_status[index] == EXIST) { tmp.Insert(_table[index]._key, _table[index]._value);//复用Insert插入 } } this->Swap(tmp);//交换this和tmp }}template >void HashTable ::Swap(HashTable & ht)//交换this和ht{ swap(_table, ht._table); swap(_status, ht._status); _size = ht._size; _capacity = ht._capacity;}template >void HashTable ::PrintTable(){ for (size_t i = 0; i < _capacity; i++) { KeyValue * tmp = _table; if (_status[i] == EXIST) { printf("第%d个位置E: %s %s\n", i, _table[i]._key.c_str(), _table[i]._value.c_str()); } if (_status[i] == EMPTY) { printf("第%d个位置N\n", i); } if (_status[i] == DELETE) { printf("第%d个位置E: %s %s\n", i, _table[i]._key.c_str(), _table[i]._value.c_str()); } }}template >int HashTable ::Find(const K& key, const V& value){ for (size_t i = 0; i < _capacity; i++) { if (_status[i] == EXIST && _table[i]._key == key && _table[i]._value == value) { return i; } } return -1;}template >bool HashTable ::Remove(const K& key, const V& value)//删除{ int pos = Find(key, value); if (pos == -1)//返回-1表示查找失败 { return false; } _status[pos] = DELETE; --_size; return true;}template >bool HashTable ::Alter(const K& key, const V& value, const K& NewKey, const V& NewValue)//改变{ int pos = Find(key, value); if (pos == -1)//返回-1表示查找失败 { return false; } _table[pos]._key = NewKey; _table[pos]._value = NewValue; return true;}
测试用例如下:
void TestKV(){ HashTableht2(5); ht2.Insert("scenluo", "萝瑟"); ht2.Insert("Peter", "张sir"); ht2.Insert("jack", "杰克"); ht2.Insert("manager", "经理"); ht2.Insert("Lafite", "拉菲"); ht2.PrintTable(); cout << "Find: " << ht2.Find("manager", "经理") << endl; cout << "Remove: " << ht2.Remove("manager", "经理") << endl; cout << "Alter: " << ht2.Alter("Lafite", "拉菲", "assistant", "助手") << endl; ht2.PrintTable();}
本文出自 “” 博客,请务必保留此出处
转载地址:http://qilbi.baihongyu.com/