返回
轻松驾驭 Pandas 的基本功能
人工智能
2024-01-28 09:58:21
Pandas 基本功能详解 | 轻松玩转 Pandas(2)
前言
在 Pandas 数据结构详解 | 轻松玩转 Pandas(1) 中,我们深入探讨了 Pandas 中常用的 Series 和 DataFrame 数据结构。在本篇文章中,我们将重点介绍这些数据结构最常用的基本功能。掌握这些功能将使你能够高效地处理和分析数据。
Series 基本功能
数据选择
head(n)
:查看前 n 行数据。tail(n)
:查看后 n 行数据。iloc[index]
:通过索引位置选择数据。loc[label]
:通过标签选择数据。
数据操作
fillna(value)
:用指定值填充缺失值。dropna()
:删除包含缺失值的行。sort_values(by, ascending)
:根据指定列对数据进行排序,ascending
指定升序(True)或降序(False)。unique()
:获取数据中唯一值。
统计计算
sum()
:求和。mean()
:求平均值。median()
:求中位数。max()
:求最大值。min()
:求最小值。
DataFrame 基本功能
数据选择
head(n)
:查看前 n 行数据。tail(n)
:查看后 n 行数据。iloc[index, column]
:通过索引位置选择数据。loc[label, column]
:通过标签选择数据。
数据操作
fillna(value)
:用指定值填充缺失值。dropna()
:删除包含缺失值的行或列。sort_values(by, ascending)
:根据指定列对数据进行排序,ascending
指定升序(True)或降序(False)。unique()
:获取数据中唯一值。drop_duplicates()
:删除重复的行。
数据合并
concat(other)
:沿指定轴连接两个或多个 DataFrame。merge(other, on, how)
:基于指定列合并两个或多个 DataFrame,how
指定合并类型。
数据转换
astype(dtype)
:将数据转换为指定数据类型。apply(function)
:将指定函数应用于 DataFrame 中的每个元素。pivot_table(index, columns, values, aggfunc)
:创建透视表,根据指定列进行聚合。
统计计算
sum()
:对每一列求和。mean()
:对每一列求平均值。median()
:对每一列求中位数。max()
:对每一列求最大值。min()
:对每一列求最小值。
总结
在本文中,我们深入探讨了 Pandas 中 Series 和 DataFrame 最常用的基本功能。这些功能可以帮助你高效地处理和分析数据。通过熟练掌握这些功能,你可以从数据中提取有价值的见解并做出明智的决策。