如何从 Pandas 数据框中删除指定序列号的行？

2024-03-12 06:25:58

在 Pandas 数据框中删除指定行：循序渐进指南

引言

Pandas 是一个强大的 Python 数据处理库，它使我们能够高效地操作和分析数据。其中一项基本任务是删除数据框中的行。本指南将介绍如何使用 Pandas drop() 方法和 index 参数从数据框中删除指定序列号的行，并附有详细的代码示例。

理解问题

假设我们有一个 Pandas 数据框 df，它包含多个行的销售数据。我们的目标是从数据框中删除序列号为 [1,2,4] 的行。

解决方案步骤

1. 创建序列号列表

首先，创建一个包含要删除行序列号的列表：

row_numbers = [1, 2, 4]

2. 使用 drop() 方法

使用 drop() 方法可以根据索引删除行。索引可以是行标签、列标签或布尔索引。在这里，我们将使用 index 参数指定要删除行的序列号：

df.drop(index=row_numbers, inplace=True)

3. 使用 inplace=True 参数

inplace=True 参数指定修改将在原始数据框 df 上直接进行，而不会创建副本。这提高了效率，因为它不需要创建新的数据框。

代码示例

结合上述步骤， voici 删除序列号为 [1,2,4] 的行的完整代码示例：

import pandas as pd

# 创建数据框
df = pd.DataFrame({
    'sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907],
    'discount': [None, None, None, None, None, None],
    'net_sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907],
    'cogs': [2.245, 5.291, 7.981, 12.686, 2.710, 6.459]
}, index=pd.MultiIndex.from_tuples([
    (600141, '20060331'),
    (600141, '20060630'),
    (600141, '20060930'),
    (600141, '20061231'),
    (600141, '20070331'),
    (600141, '20070630')
]))

# 创建序列号列表
row_numbers = [1, 2, 4]

# 使用 drop() 方法删除行
df.drop(index=row_numbers, inplace=True)

# 打印更新后的数据框
print(df)