Python Numpy 结构化数组索引揭秘

2023-12-27 20:58:40

揭秘 NumPy 结构化数组的索引奥秘：数据科学与机器学习中的利器

简介

对于数据科学和机器学习领域的开发人员来说，NumPy 库无疑是处理科学计算和数据操作的神兵利器。其中，NumPy 结构化数组以其支持多数据类型字段的特性，成为应对复杂数据结构的利器。本文将深入探究 NumPy 结构化数组中的索引操作，揭开其奥妙。

NumPy 结构化数组索引基础

NumPy 结构化数组的索引与普通 NumPy 数组非常相似。您可以使用方括号 ([ ]) 进行索引，但需要注意以下几点：

索引字段名称： NumPy 结构化数组的索引可以使用字段名称。例如，array["name"] 将返回所有名为 "name" 的字段值。
多个索引： 您可以使用逗号 (,) 分隔多个索引。例如，array[["name", "age"]] 将返回两个字段的子数组。
布尔索引： 您可以使用布尔数组对结构化数组进行索引。例如，array[array["age"] > 18] 将返回所有年龄大于 18 的行。

高级索引技巧

除了基本索引外，NumPy 结构化数组还支持高级索引技巧，例如：

fancy indexing： 允许您使用一组索引来索引结构化数组。例如，array[["Alice", "Bob"]] 将返回具有 "Alice" 和 "Bob" 名称的行。
切片索引： 类似于 NumPy 数组，您可以使用切片 ([:]) 对结构化数组进行切片。例如，array["name"][0:5] 将返回前 5 个名称字段。
高级布尔索引： 您可以使用 NumPy 中的布尔索引功能来对结构化数组进行更高级的过滤。例如，array[np.logical_and(array["age"] > 18, array["gender"] == "male")] 将返回所有年龄大于 18 且性别为男性的行。

索引示例

让我们通过一些示例来进一步了解 NumPy 结构化数组索引：

import numpy as np

# 创建一个结构化数组
data = np.array([("Alice", 20, "Female"), ("Bob", 25, "Male"), ("John", 30, "Male")],
                dtype=[("name", "U10"), ("age", "i4"), ("gender", "U10")])

# 根据字段名称索引
print(data["name"])

# 根据多个字段名称索引
print(data[["name", "age"]])

# 布尔索引
print(data[data["age"] > 25])

# fancy indexing
print(data[["Alice", "Bob"]])

# 切片索引
print(data["name"][0:2])

# 高级布尔索引
print(data[np.logical_and(data["age"] > 20, data["gender"] == "Male")])