C++哈希hash从基础到高级

IOS

2024-01-27 18:59:41

探索哈希表的奥秘：快速查找和插入数据的强大工具

哈希表，是计算机科学中经常使用的关键数据结构之一。它们因其极快的查找和插入速度而闻名，即使在处理大量数据时也能保持高效。在本文中，我们将深入探讨哈希表的迷人世界，了解它们的工作原理、不同的实现方式，以及应对哈希冲突的策略。

什么是哈希表？

想象一下一个图书馆，里面有成千上万的书籍，每一本书都有一个独特的标识符，称为 ISBN 号码。如果你想找到一本特定的书，一个接一个地翻阅所有书架会非常耗时。但是，如果有一个哈希表，它将 ISBN 号码映射到书架号，你可以立即找到这本书。

哈希表就是这样工作的，它使用一个称为哈希函数的巧妙数学公式将键（如 ISBN 号码）映射到值（如书架号）。哈希函数将键转换为一个唯一的数字，称为哈希值，然后使用该哈希值在哈希表中查找相应的值。

哈希表的实现

哈希表有多种实现方式，但最常见的是：

哈希数组： 使用数组将哈希值映射到值。
哈希链表： 使用链表将哈希值映射到值，每个链表节点包含一个键和一个值。

处理哈希冲突

当不同的键哈希到同一个值时，就会发生哈希冲突。为了解决这个问题，有两种主要的策略：

链地址法： 每个哈希值链接到一个链表，存储发生冲突的键和值。
开放地址法： 允许在哈希表中插入多个键，这些键会存储在哈希值的下一个可用位置。

哈希函数

哈希函数是哈希表的关键组成部分，其质量直接影响哈希表的性能。良好的哈希函数应该：

快速： 快速计算哈希值。
均匀分布： 将键均匀地分布在哈希表中，以减少冲突。
确定性： 对于相同的键总是产生相同的哈希值。

一些常见的哈希函数包括：

MD5 哈希函数
SHA-1 哈希函数
SHA-256 哈希函数

代码示例

// 哈希数组示例

#include <iostream>
#include <vector>

using namespace std;

const int HASH_SIZE = 10;  // 哈希表的长度

struct KeyValue {
  string key;
  int value;
};

vector<KeyValue> hashArray[HASH_SIZE];  // 哈希数组

int hashFunction(string key) {
  // 简单的哈希函数，将字符串的 ASCII 值求和
  int hash = 0;
  for (char c : key) {
    hash += (int)c;
  }
  return hash % HASH_SIZE;  // 对哈希表长度取模
}

void insert(string key, int value) {
  int hash = hashFunction(key);
  hashArray[hash].push_back({key, value});
}

int find(string key) {
  int hash = hashFunction(key);
  for (KeyValue& kv : hashArray[hash]) {
    if (kv.key == key) {
      return kv.value;
    }
  }
  return -1;  // 如果没有找到，返回 -1
}

int main() {
  insert("apple", 10);
  insert("banana", 20);
  insert("cherry", 30);

  cout << "banana 的值是：" << find("banana") << endl;
  cout << "不存在的键的值是：" << find("不存在的键") << endl;
}