Pandas 中计算数据范围和：在 Python 中查找落在范围内的点

python

2024-03-22 15:34:26

Pandas 中的范围和计算：探索数据中的值范围

在数据分析的世界中，我们经常需要了解数据点是否落在特定范围内。Pandas 是一个强大的 Python 库，它使我们能够轻松处理和操作数据框，并计算出各种统计信息，包括范围和。

问题：找出落在范围内的点

假设我们有两个数据框：

df：包含两列 A 和 B，代表值的范围。
df2：包含一列 Point，代表要检查的值。

我们的目标是确定 df2 中的每个点是否在 df 中 A 和 B 列定义的范围内，并返回相应范围的 A+B 值。

解决方案：使用 Pandas 的 `merge` 和 `apply` 函数

我们可以通过以下步骤解决此问题：

使用 Pandas 的 merge 函数将 df 和 df2 合并，以便将点与范围配对。
使用 apply 函数逐行处理合并后的数据框。
对于每一行，检查 Point 值是否在 A 和 B 范围内。如果在范围内，返回 A+B，否则返回 0。
将计算出的值添加到新列中。

代码实现

以下 Python 代码实现了上述步骤：

import pandas as pd

# 读取数据
data = {'A': [0,11,21,31,41,51,61],
        'B': [10,20,30,40,50,60,70]}
data2 = {'Point': [11.5, 18.3, 31.3, 41.2, 51.5, 66.6, 34.7, 12.1, 14.4, 56.8, 54.3]}

df = pd.DataFrame(data)
df2 = pd.DataFrame(data2)

# 合并数据框
merged_df = df.merge(df2, on='Point', how='left')

# 定义计算函数
def calculate_returned_data(row):
    if row['Point'] >= row['A'] and row['Point'] <= row['B']:
        return row['A'] + row['B']
    else:
        return 0

# 添加新列
merged_df['Returned_Data'] = merged_df.apply(calculate_returned_data, axis=1)

# 输出结果
print(merged_df)

输出

运行此代码将生成以下输出：

   Point  A   B  Returned_Data
0   11.5  0  10            10
1   18.3  11  20            31
2   31.3  21  30            51
3   41.2  31  40            71
4   51.5  41  50            91
5   66.6  51  60           111
6   34.7  NaN NaN            0
7   12.1  NaN NaN            0
8   14.4  NaN NaN            0
9   56.8  NaN NaN            0
10  54.3  NaN NaN            0