Python 中找出列表中的重复项并创建新列表：四种方法

2024-03-04 02:00:00

找出列表中的重复项并创建新列表

引言

在数据分析和处理中，找出列表中的重复项并创建包含这些重复项的新列表是一个常见且有用的任务。在 Python 中，我们可以使用多种方法来实现这一目标，每种方法都有其自身的优势和缺点。

方法

1. 使用集合（set）

集合是一种无序且不包含重复元素的数据结构。我们可以通过将列表转换为集合，然后将集合转换回列表，来去除列表中的重复项。例如：

list1 = [1, 2, 3, 4, 5, 1, 2, 3]

# 创建集合以去除重复项
set1 = set(list1)

# 将集合转换回列表
list2 = list(set1)

print(list2)  # 输出：[1, 2, 3, 4, 5]

2. 使用字典（dict）

字典是一种关联数组，其中每个键（key）与一个值（value）相关联。我们可以通过使用字典来跟踪列表中的重复项，方法是将列表中的每个元素作为字典的键，并使用该键出现的次数作为字典的值。然后，我们可以过滤字典以仅保留重复项。例如：

list1 = [1, 2, 3, 4, 5, 1, 2, 3]

# 创建字典以跟踪重复项
dict1 = {}
for item in list1:
    if item not in dict1:
        dict1[item] = 1
    else:
        dict1[item] += 1

# 过滤字典以仅保留重复项
duplicates = [key for key, value in dict1.items() if value > 1]

print(duplicates)  # 输出：[1, 2, 3]

3. 使用 Counter（Counter）

Counter 是一种内置的 Python 数据结构，用于跟踪元素在序列中的计数。我们可以使用 Counter 来轻松找出列表中的重复项。例如：

list1 = [1, 2, 3, 4, 5, 1, 2, 3]

# 创建 Counter 以跟踪重复项
counter = collections.Counter(list1)

# 过滤 Counter 以仅保留重复项
duplicates = [key for key, value in counter.items() if value > 1]

print(duplicates)  # 输出：[1, 2, 3]

4. 使用循环

虽然前面的方法更有效，但我们也可以使用循环来找出列表中的重复项。一种方法是遍历列表并比较每个元素与列表中的所有其他元素。如果找到重复项，则将该元素添加到新列表中。例如：

list1 = [1, 2, 3, 4, 5, 1, 2, 3]

# 创建新列表以存储重复项
duplicates = []

# 遍历列表
for i in range(len(list1)):

    # 比较当前元素与列表中的所有其他元素
    for j in range(i + 1, len(list1)):

        # 如果找到重复项，则将该元素添加到新列表中
        if list1[i] == list1[j] and list1[i] not in duplicates:
            duplicates.append(list1[i])

print(duplicates)  # 输出：[1, 2, 3]