从耗时6秒到十几毫秒，LeetCode统计大样本数据时的效率优化实践

前端

2023-11-09 09:48:54

优化LeetCode大样本数据统计题的耗时技巧

在解决 LeetCode 上涉及大样本数据的统计问题时，计算耗时往往是一个不容忽视的重要因素。本文将以一道 LeetCode 题目为例，分享我优化计算耗时过程中的经验，希望能够帮助大家提高解决此类问题的效率。

朴素解法：暴力搜索

刚开始接触这类题目时，人们往往采用朴素的暴力搜索解法。例如，对于统计数组中满足特定条件的元素对的个数，朴素解法是使用双重循环对数组中的所有元素进行遍历和比较。虽然这种方法简单易懂，但当数据量较大时，计算耗时会非常高。

哈希表优化：减少重复搜索

为了减少暴力搜索的计算量，我们可以使用哈希表来存储已经遍历过的元素。这样，每次遍历数组时，都可以快速查询该元素是否已经在哈希表中，从而避免重复搜索。哈希表优化可以显著降低计算耗时，特别是当数据量较大时。

树状数组优化：快速范围查询

树状数组是一种高效的数据结构，可以支持范围查询和单点更新。在统计问题中，我们可以使用树状数组来存储元素的出现次数。通过树状数组，我们可以快速查询给定范围内的元素个数，从而进一步降低计算耗时。

位运算和离散化优化：进一步提升效率

位运算可以将数字转换为二进制形式，从而减少比较和计算的次数。离散化可以将元素映射到一个较小的整数范围内，从而简化计算。将位运算和离散化技术应用于算法优化中，可以进一步提升算法效率。

代码示例

下面是一个使用树状数组优化后，统计数组中满足特定条件的元素对个数的代码示例：

class FenwickTree:
    def __init__(self, n):
        self.tree = [0] * (n + 1)

    def update(self, i, val):
        while i < len(self.tree):
            self.tree[i] += val
            i += (i & -i)

    def sum(self, i):
        res = 0
        while i > 0:
            res += self.tree[i]
            i -= (i & -i)
        return res

def count_pairs(nums, target):
    # 构建树状数组
    fenwick_tree = FenwickTree(max(nums) + 1)
    count = 0

    for num in nums:
        # 查询小于等于num的元素个数
        count += fenwick_tree.sum(num)
        # 更新num的出现次数
        fenwick_tree.update(num, 1)

    return count