揭秘 Python `len()` 函数开销：为代码性能注入动力

2024-03-26 17:28:57

洞悉 len() 函数开销：提升 Python 代码性能

在 Python 的强大功能库中，len() 函数扮演着至关重要的角色，它能轻而易举地获取序列的长度。然而，当你踏上性能优化的征程时，深入了解 len() 函数的开销就显得尤为关键。本文将深入探讨 len() 函数在不同数据结构上的开销，为你的代码优化之旅提供坚实的基础。

揭秘 `len()` 的面纱：数据结构与开销

列表

对于列表，len() 函数的开销是一个固定的 O(1) ，这意味着无论列表有多大，获取其长度的时间复杂度始终为常数。

元组

与列表类似，len() 函数在元组上的开销也是 O(1) 。这是因为元组是不可变序列，其长度在创建后便已确定，因此 len() 可以直接从元组对象中快速检索到长度信息。

字符串

字符串的 len() 开销同样为 O(1) 。Python 中的字符串是不可变序列，与元组类似，其长度在创建时就已确定，可以通过直接访问字符串对象获取。

字典

不同于前述数据结构，字典的 len() 开销为 O(n) 。这是因为字典是无序集合，其长度取决于存储在字典中的键值对数量。因此，len() 需要遍历整个字典以计算其长度。

优化策略：提升代码性能

了解 len() 函数的开销后，你可以采取以下策略优化代码性能：

缓存长度 ：如果代码中多次使用 len() 函数，请考虑将长度值缓存起来，以避免重复遍历数据结构。
预分配空间 ：对于可变序列（如列表和元组），如果你知道序列的预期大小，请预先分配足够的空间，避免不必要的重新分配操作。
选择合适的结构 ：根据数据访问模式，选择合适的的数据结构。例如，如果你需要频繁获取长度，优先选择具有 O(1) 开销的列表或元组。

代码示例：衡量 `len()` 函数的开销

import time

# 列表
list_length = 1000000
start = time.time()
list_len = len(list(range(list_length)))
end = time.time()
print(f"List length: {list_len}, Time: {end - start}")

# 元组
tuple_length = 1000000
start = time.time()
tuple_len = len(tuple(range(tuple_length)))
end = time.time()
print(f"Tuple length: {tuple_len}, Time: {end - start}")

# 字符串
string_length = 1000000
start = time.time()
string_len = len("a" * string_length)
end = time.time()
print(f"String length: {string_len}, Time: {end - start}")

# 字典
dict_length = 1000000
start = time.time()
dict_len = len({i: i for i in range(dict_length)})
end = time.time()
print(f"Dictionary length: {dict_len}, Time: {end - start}")