Python 读取 Excel 表格数据，玩转数据分析

2023-12-20 01:25:13

掌握使用Python处理Excel文件的技能，能够让数据分析过程更加高效便捷。无论是简单的数据提取还是复杂的数据转换，通过适当的库支持都可以轻松实现。接下来，我们将探讨如何利用Python读取、写入以及操作Excel表格，并提供相应的代码示例。

安装所需库

要开始处理Excel文件，首先需要安装pandas和openpyxl这两个关键的Python库。使用以下命令进行安装：

pip install pandas openpyxl

读取Excel文件

使用Pandas

利用pandas可以方便地读取Excel文件，并将数据存储在DataFrame中，从而便于后续的数据操作。

代码示例：

import pandas as pd

# 指定文件路径
file_path = 'data.xlsx'

# 读取Excel文件中的Sheet1
df = pd.read_excel(file_path, sheet_name='Sheet1', engine='openpyxl')

print(df)

操作步骤：

首先导入pandas库。
使用pd.read_excel()函数指定Excel的路径，选择特定的工作表。如果未指明工作表，默认读取第一个工作表。
输出结果查看数据。

写入Excel文件

使用Pandas

写入数据到Excel同样可以通过pandas实现，将DataFrame写回Excel文件中，并可以自定义工作表的名称和位置。

代码示例：

import pandas as pd

# 创建一个简单的DataFrame
data = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
df = pd.DataFrame(data)

# 指定文件路径以及写入方式
output_file_path = 'output_data.xlsx'
with pd.ExcelWriter(output_file_path, engine='openpyxl') as writer:
    df.to_excel(writer, sheet_name='Sheet1', index=False)

操作步骤：

创建一个包含数据的DataFrame。
使用pd.ExcelWriter()指定输出文件路径，选择写入引擎。
利用to_excel()方法将DataFrame内容写入Excel。

操作Excel数据

数据筛选与排序

利用pandas提供的函数可以对读取到的数据进行更复杂的操作，如数据筛选和排序。

代码示例：

import pandas as pd

# 假设df是从Excel中读取的数据DataFrame
filtered_df = df[df['Age'] > 25]  # 筛选年龄大于25的人
sorted_df = filtered_df.sort_values(by='Name')  # 按姓名排序

print(sorted_df)

操作步骤：