返回
用好pandas读写数据,轻松搞定数据分析
后端
2024-02-07 08:55:33
作为数据分析领域的利器,pandas凭借其强大的数据处理能力,受到广大数据分析师的青睐。在数据分析的实际应用中,数据往往来自不同的来源,为了方便分析,需要将这些数据导入到pandas中进行处理,而pandas也提供了多种数据源的读写方法。
一、文件读写
1. CSV文件
(1) 读CSV文件
import pandas as pd
# 读取CSV文件,并将其存储在变量df中
df = pd.read_csv('data.csv')
# 打印数据
print(df)
(2) 写CSV文件
# 将数据写入CSV文件
df.to_csv('output.csv', index=False)
2. Excel文件
(1) 读Excel文件
# 读取Excel文件,并将其存储在变量df中
df = pd.read_excel('data.xlsx')
# 打印数据
print(df)
(2) 写Excel文件
# 将数据写入Excel文件
df.to_excel('output.xlsx', index=False)
二、数据库读写
1. MySQL数据库
(1) 读MySQL数据库
import pymysql
# 连接数据库
conn = pymysql.connect(host='localhost', user='root', password='123456', db='test')
# 创建游标
cursor = conn.cursor()
# 执行查询
cursor.execute("SELECT * FROM users")
# 获取查询结果
results = cursor.fetchall()
# 关闭游标
cursor.close()
# 关闭连接
conn.close()
# 将查询结果转换成pandas DataFrame
df = pd.DataFrame(results, columns=['id', 'name', 'email'])
# 打印数据
print(df)
(2) 写MySQL数据库
import pymysql
# 连接数据库
conn = pymysql.connect(host='localhost', user='root', password='123456', db='test')
# 创建游标
cursor = conn.cursor()
# 执行插入操作
cursor.execute("INSERT INTO users (name, email) VALUES ('John', 'john@example.com')")
# 提交事务
conn.commit()
# 关闭游标
cursor.close()
# 关闭连接
conn.close()
2. PostgreSQL数据库
(1) 读PostgreSQL数据库
import psycopg2
# 连接数据库
conn = psycopg2.connect(host='localhost', user='postgres', password='123456', dbname='test')
# 创建游标
cursor = conn.cursor()
# 执行查询
cursor.execute("SELECT * FROM users")
# 获取查询结果
results = cursor.fetchall()
# 关闭游标
cursor.close()
# 关闭连接
conn.close()
# 将查询结果转换成pandas DataFrame
df = pd.DataFrame(results, columns=['id', 'name', 'email'])
# 打印数据
print(df)
(2) 写PostgreSQL数据库
import psycopg2
# 连接数据库
conn = psycopg2.connect(host='localhost', user='postgres', password='123456', dbname='test')
# 创建游标
cursor = conn.cursor()
# 执行插入操作
cursor.execute("INSERT INTO users (name, email) VALUES ('John', 'john@example.com')")
# 提交事务
conn.commit()
# 关闭游标
cursor.close()
# 关闭连接
conn.close()
三、剪贴板读写
1. 读剪贴板
import pandas as pd
# 从剪贴板读取数据,并将其存储在变量df中
df = pd.read_clipboard()
# 打印数据
print(df)
2. 写剪贴板
import pandas as pd
# 将数据写入剪贴板
df.to_clipboard()
结语
掌握pandas的数据读写操作,能够帮助数据分析师轻松地将数据导入到pandas中进行处理,并能够将处理结果输出到文件、数据库或剪贴板中,方便进一步分析或分享。