数据结构与算法的扫尘日记(一)——查找

2024-01-10 00:10:57

数据结构与算法的“扫尘之旅”

数据结构与算法是计算机科学的基础，对于解决现实世界中的各种问题至关重要。随着时间的推移，我们的知识可能会变得陈旧，因此定期进行“扫尘”非常有必要。在这个博客中，我们将深入探讨数据结构和算法的经典查找方法，了解最新技术，并展望未来趋势。

纵览查找，窥探高效

查找算法是数据结构和算法的重要组成部分，它们使我们能够高效地从数据集合中检索数据。我们首先考察朴素查找算法，它简单易用，但效率较低。然后，我们将研究二分查找算法，它对于有序数据集合非常高效。最后，我们将介绍散列表，它使用哈希函数在 O(1) 时间内查找数据。

朴素查找：漫步数据集合的简单之道

朴素查找算法以线性方式遍历整个数据集合，逐个元素进行比较。它的优点在于简单易用，但在大型数据集上效率不高。时间复杂度为 O(n)，其中 n 是数据集合的大小。

def linear_search(data, target):
    for item in data:
        if item == target:
            return True
    return False

二分查找：分而治之的快速利刃

二分查找算法利用有序数据集合的特性，每次将搜索范围缩小一半。它通过比较中间元素与目标值来确定目标值位于左侧还是右侧，从而快速收敛到目标值。时间复杂度为 O(log n)。

def binary_search(data, target):
    low = 0
    high = len(data) - 1

    while low <= high:
        mid = (low + high) // 2
        if data[mid] == target:
            return True
        elif data[mid] < target:
            low = mid + 1
        else:
            high = mid - 1

    return False

散列表：哈希函数的快速寻觅之道

散列表使用哈希函数将数据映射到一个称为“散列表”的数组中。通过哈希函数，我们可以直接访问数据，而无需遍历整个集合。散列表的时间复杂度通常为 O(1)，但哈希冲突可能会降低效率。

class HashTable:
    def __init__(self):
        self.table = [[] for _ in range(100)]

    def insert(self, key, value):
        hash_key = hash(key) % len(self.table)
        self.table[hash_key].append((key, value))

    def get(self, key):
        hash_key = hash(key) % len(self.table)
        for k, v in self.table[hash_key]:
            if k == key:
                return v
        return None