返回

用好pandas读写数据,轻松搞定数据分析

后端

作为数据分析领域的利器,pandas凭借其强大的数据处理能力,受到广大数据分析师的青睐。在数据分析的实际应用中,数据往往来自不同的来源,为了方便分析,需要将这些数据导入到pandas中进行处理,而pandas也提供了多种数据源的读写方法。

一、文件读写

1. CSV文件

(1) 读CSV文件

import pandas as pd

# 读取CSV文件,并将其存储在变量df中
df = pd.read_csv('data.csv')

# 打印数据
print(df)

(2) 写CSV文件

# 将数据写入CSV文件
df.to_csv('output.csv', index=False)

2. Excel文件

(1) 读Excel文件

# 读取Excel文件,并将其存储在变量df中
df = pd.read_excel('data.xlsx')

# 打印数据
print(df)

(2) 写Excel文件

# 将数据写入Excel文件
df.to_excel('output.xlsx', index=False)

二、数据库读写

1. MySQL数据库

(1) 读MySQL数据库

import pymysql

# 连接数据库
conn = pymysql.connect(host='localhost', user='root', password='123456', db='test')

# 创建游标
cursor = conn.cursor()

# 执行查询
cursor.execute("SELECT * FROM users")

# 获取查询结果
results = cursor.fetchall()

# 关闭游标
cursor.close()

# 关闭连接
conn.close()

# 将查询结果转换成pandas DataFrame
df = pd.DataFrame(results, columns=['id', 'name', 'email'])

# 打印数据
print(df)

(2) 写MySQL数据库

import pymysql

# 连接数据库
conn = pymysql.connect(host='localhost', user='root', password='123456', db='test')

# 创建游标
cursor = conn.cursor()

# 执行插入操作
cursor.execute("INSERT INTO users (name, email) VALUES ('John', 'john@example.com')")

# 提交事务
conn.commit()

# 关闭游标
cursor.close()

# 关闭连接
conn.close()

2. PostgreSQL数据库

(1) 读PostgreSQL数据库

import psycopg2

# 连接数据库
conn = psycopg2.connect(host='localhost', user='postgres', password='123456', dbname='test')

# 创建游标
cursor = conn.cursor()

# 执行查询
cursor.execute("SELECT * FROM users")

# 获取查询结果
results = cursor.fetchall()

# 关闭游标
cursor.close()

# 关闭连接
conn.close()

# 将查询结果转换成pandas DataFrame
df = pd.DataFrame(results, columns=['id', 'name', 'email'])

# 打印数据
print(df)

(2) 写PostgreSQL数据库

import psycopg2

# 连接数据库
conn = psycopg2.connect(host='localhost', user='postgres', password='123456', dbname='test')

# 创建游标
cursor = conn.cursor()

# 执行插入操作
cursor.execute("INSERT INTO users (name, email) VALUES ('John', 'john@example.com')")

# 提交事务
conn.commit()

# 关闭游标
cursor.close()

# 关闭连接
conn.close()

三、剪贴板读写

1. 读剪贴板

import pandas as pd

# 从剪贴板读取数据,并将其存储在变量df中
df = pd.read_clipboard()

# 打印数据
print(df)

2. 写剪贴板

import pandas as pd

# 将数据写入剪贴板
df.to_clipboard()

结语

掌握pandas的数据读写操作,能够帮助数据分析师轻松地将数据导入到pandas中进行处理,并能够将处理结果输出到文件、数据库或剪贴板中,方便进一步分析或分享。