返回
Python 数据处理:剖析 Excel 数据导入导出技巧
人工智能
2023-09-01 11:59:37
导语:
在数据分析领域,Python 凭借其强大的数据处理能力备受青睐。而其中,处理 Excel 数据是不可避免的环节。本文将深入探究 Python 导入导出 Excel 数据的技巧,为读者提供全面的指南。
导入 Excel 数据
导入 Excel 数据的方法有多种,具体取决于数据的格式和需求。
1. pandas.read_excel()
pandas.read_excel() 是最常用的方法,支持各种 Excel 文件格式,包括 xls、xlsx 和 xlsm。它提供了丰富的参数,例如 sheet_name 指定要读取的工作表,header 指定表头行位置,以及 dtype 指定数据类型。
import pandas as pd
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
2. openpyxl
openpyxl 是另一个流行的 Python 库,用于处理 Excel 文件。它提供了更低级别的访问,允许对工作表、行和单元格进行详细的操作。
from openpyxl import load_workbook
wb = load_workbook('data.xlsx')
sheet = wb.active
data = []
for row in sheet.rows:
data.append([cell.value for cell in row])
3. xlrd
xlrd 主要用于读取 Excel 文件,并提供对工作表和单元格的访问。它支持 XLS 格式,但不支持 XLSX。
import xlrd
workbook = xlrd.open_workbook('data.xls')
sheet = workbook.sheet_by_index(0)
data = []
for rownum in range(sheet.nrows):
data.append(sheet.row_values(rownum))
导出 Excel 数据
导出 Excel 数据的方法也多种多样。
1. pandas.to_excel()
pandas.to_excel() 方法直接将 DataFrame 写入 Excel 文件。它支持指定工作表名称、列宽和格式等选项。
df.to_excel('data.xlsx', sheet_name='Sheet1', index=False)
2. openpyxl
openpyxl 库允许创建新的 Excel 工作簿和工作表。
from openpyxl import Workbook
wb = Workbook()
sheet = wb.active
for i, row in enumerate(data):
for j, value in enumerate(row):
sheet.cell(row=i+1, column=j+1, value=value)
wb.save('data.xlsx')
3. xlsxwriter
xlsxwriter 库是一个用于创建 XLSX 文件的高性能库。它提供了一个高级 API,可以对工作簿和工作表进行更精细的控制。
import xlsxwriter
workbook = xlsxwriter.Workbook('data.xlsx')
sheet = workbook.add_worksheet('Sheet1')
for i, row in enumerate(data):
for j, value in enumerate(row):
sheet.write(i, j, value)
workbook.close()
SEO 优化