返回

Python 数据处理:剖析 Excel 数据导入导出技巧

人工智能

导语:

在数据分析领域,Python 凭借其强大的数据处理能力备受青睐。而其中,处理 Excel 数据是不可避免的环节。本文将深入探究 Python 导入导出 Excel 数据的技巧,为读者提供全面的指南。

导入 Excel 数据

导入 Excel 数据的方法有多种,具体取决于数据的格式和需求。

1. pandas.read_excel()

pandas.read_excel() 是最常用的方法,支持各种 Excel 文件格式,包括 xls、xlsx 和 xlsm。它提供了丰富的参数,例如 sheet_name 指定要读取的工作表,header 指定表头行位置,以及 dtype 指定数据类型。

import pandas as pd

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')

2. openpyxl

openpyxl 是另一个流行的 Python 库,用于处理 Excel 文件。它提供了更低级别的访问,允许对工作表、行和单元格进行详细的操作。

from openpyxl import load_workbook

wb = load_workbook('data.xlsx')
sheet = wb.active
data = []
for row in sheet.rows:
    data.append([cell.value for cell in row])

3. xlrd

xlrd 主要用于读取 Excel 文件,并提供对工作表和单元格的访问。它支持 XLS 格式,但不支持 XLSX。

import xlrd

workbook = xlrd.open_workbook('data.xls')
sheet = workbook.sheet_by_index(0)
data = []
for rownum in range(sheet.nrows):
    data.append(sheet.row_values(rownum))

导出 Excel 数据

导出 Excel 数据的方法也多种多样。

1. pandas.to_excel()

pandas.to_excel() 方法直接将 DataFrame 写入 Excel 文件。它支持指定工作表名称、列宽和格式等选项。

df.to_excel('data.xlsx', sheet_name='Sheet1', index=False)

2. openpyxl

openpyxl 库允许创建新的 Excel 工作簿和工作表。

from openpyxl import Workbook

wb = Workbook()
sheet = wb.active

for i, row in enumerate(data):
    for j, value in enumerate(row):
        sheet.cell(row=i+1, column=j+1, value=value)

wb.save('data.xlsx')

3. xlsxwriter

xlsxwriter 库是一个用于创建 XLSX 文件的高性能库。它提供了一个高级 API,可以对工作簿和工作表进行更精细的控制。

import xlsxwriter

workbook = xlsxwriter.Workbook('data.xlsx')
sheet = workbook.add_worksheet('Sheet1')

for i, row in enumerate(data):
    for j, value in enumerate(row):
        sheet.write(i, j, value)

workbook.close()

SEO 优化