返回

轻松驾驭 Pandas 的基本功能

人工智能

Pandas 基本功能详解 | 轻松玩转 Pandas(2)

前言

Pandas 数据结构详解 | 轻松玩转 Pandas(1) 中,我们深入探讨了 Pandas 中常用的 Series 和 DataFrame 数据结构。在本篇文章中,我们将重点介绍这些数据结构最常用的基本功能。掌握这些功能将使你能够高效地处理和分析数据。

Series 基本功能

数据选择

  • head(n):查看前 n 行数据。
  • tail(n):查看后 n 行数据。
  • iloc[index]:通过索引位置选择数据。
  • loc[label]:通过标签选择数据。

数据操作

  • fillna(value):用指定值填充缺失值。
  • dropna():删除包含缺失值的行。
  • sort_values(by, ascending):根据指定列对数据进行排序,ascending 指定升序(True)或降序(False)。
  • unique():获取数据中唯一值。

统计计算

  • sum():求和。
  • mean():求平均值。
  • median():求中位数。
  • max():求最大值。
  • min():求最小值。

DataFrame 基本功能

数据选择

  • head(n):查看前 n 行数据。
  • tail(n):查看后 n 行数据。
  • iloc[index, column]:通过索引位置选择数据。
  • loc[label, column]:通过标签选择数据。

数据操作

  • fillna(value):用指定值填充缺失值。
  • dropna():删除包含缺失值的行或列。
  • sort_values(by, ascending):根据指定列对数据进行排序,ascending 指定升序(True)或降序(False)。
  • unique():获取数据中唯一值。
  • drop_duplicates():删除重复的行。

数据合并

  • concat(other):沿指定轴连接两个或多个 DataFrame。
  • merge(other, on, how):基于指定列合并两个或多个 DataFrame,how 指定合并类型。

数据转换

  • astype(dtype):将数据转换为指定数据类型。
  • apply(function):将指定函数应用于 DataFrame 中的每个元素。
  • pivot_table(index, columns, values, aggfunc):创建透视表,根据指定列进行聚合。

统计计算

  • sum():对每一列求和。
  • mean():对每一列求平均值。
  • median():对每一列求中位数。
  • max():对每一列求最大值。
  • min():对每一列求最小值。

总结

在本文中,我们深入探讨了 Pandas 中 Series 和 DataFrame 最常用的基本功能。这些功能可以帮助你高效地处理和分析数据。通过熟练掌握这些功能,你可以从数据中提取有价值的见解并做出明智的决策。