返回

掌握Seaborn:5 分钟入门教程(第 3 部分)—箱形图和提琴图

人工智能

Seaborn 是一个基于 Matplotlib 的 Python 可视化库,它提供了一个高级界面来绘制引人注目的统计图形。与 Matplotlib 相比,Seaborn 提供了更高层次的 API 封装,让绘图变得更加容易,无需大量调整即可绘制出精美的图形。

在本文中,我们将介绍 Seaborn 中的箱形图和提琴图。这些图是显示数据分布和比较数据集的强大工具。

箱形图

箱形图是一种显示数据分布和中心趋势的图形。它由一个盒子和两条线组成:

  • 盒子 :表示数据的四分位数范围(Q1、Q2、Q3)
  • 线 :表示最小值和最大值(或其他指定的百分位数)

箱形图的示例:

[图片 of 箱形图]

从箱形图中,我们可以观察到数据的分布:

  • 数据的中心趋势(中位数)位于盒子的中间线
  • 数据的范围由箱子的长度表示
  • 四分位数范围由盒子的宽度表示
  • 异常值由盒子外部的线表示

提琴图

提琴图是箱形图的变体,它显示了数据的概率密度函数。提琴图由一个带有密度的轮廓和一条代表中位数的线组成:

[图片 of 提琴图]

提琴图提供了比箱形图更详细的信息:

  • 概率密度函数显示了数据在不同值处的分布
  • 中位数线指示数据的中心趋势
  • 不同数据集的提琴图可以轻松比较分布的相似性和差异性

使用 Seaborn 绘制箱形图和提琴图

使用 Seaborn 绘制箱形图和提琴图非常简单。对于箱形图,可以使用 boxplot() 函数:

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

# 创建一个示例 DataFrame
df = pd.DataFrame({
    "data": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
})

# 绘制箱形图
sns.boxplot(data=df["data"])
plt.show()

对于提琴图,可以使用 violinplot() 函数:

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

# 创建一个示例 DataFrame
df = pd.DataFrame({
    "data": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
})

# 绘制提琴图
sns.violinplot(data=df["data"])
plt.show()

结论

箱形图和提琴图是探索和可视化数据分布的强大工具。Seaborn 提供了一个简单且高效的方法来绘制这些图形。通过利用 Seaborn,您可以轻松创建引人注目的图形,从而更深入地了解您的数据。