返回
Python Pandas处理基础入门简单题汇总
后端
2023-12-25 09:57:03
大家好,我是皮皮。
一、前言
前几天在Python星耀交流群【dcpeng】问了一个Pandas基础的问题,提问截图如下:
[图片]
原始代码如下:
import pandas as pd
df = pd.DataFrame({'name': ['John', 'Mary', 'Bob', 'Alice'],
'age': [20, 25, 30, 35],
'city': ['New York', 'London', 'Paris', 'Tokyo']})
# 练习题1:如何将name列的值设置为大写?
df['name'] = df['name'].str.upper()
# 练习题2:如何将age列的值增加5岁?
df['age'] = df['age'] + 5
# 练习题3:如何将city列的值全部替换为“Beijing”?
df['city'] = 'Beijing'
# 练习题4:如何将DataFrame中的所有值转换为字符串?
df = df.astype(str)
# 练习题5:如何将DataFrame中缺失的值替换为0?
df.fillna(0, inplace=True)
# 练习题6:如何将DataFrame中的重复行删除?
df.drop_duplicates(inplace=True)
# 练习题7:如何将DataFrame中的数据按照age列排序?
df.sort_values(by='age', inplace=True)
# 练习题8:如何将DataFrame中的前5行数据输出到控制台?
print(df.head(5))
这个题目还是有点难度的,感兴趣的话,大家也可以尝试下。
二、Pandas基础练习题汇总
下面是一些Pandas基础的练习题,旨在帮助您掌握Pandas的基本操作和用法。这些练习题涵盖了Pandas中各种常见的数据处理和分析任务,包括数据读取、数据清洗、数据转换、数据分组、数据聚合等。通过这些练习题,您可以逐步掌握Pandas的各种核心功能,并为更深入的数据分析奠定基础。
练习题1:如何创建一个DataFrame?
import pandas as pd
# 从字典中创建DataFrame
data = {'name': ['John', 'Mary', 'Bob', 'Alice'],
'age': [20, 25, 30, 35],
'city': ['New York', 'London', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)
# 从列表中创建DataFrame
data = [['John', 20, 'New York'],
['Mary', 25, 'London'],
['Bob', 30, 'Paris'],
['Alice', 35, 'Tokyo']]
df = pd.DataFrame(data, columns=['name', 'age', 'city'])
练习题2:如何读取CSV文件中的数据?
import pandas as pd
# 从CSV文件中读取数据
df = pd.read_csv('data.csv')
练习题3:如何清洗数据?
import pandas as pd
# 删除缺失值
df.dropna(inplace=True)
# 替换缺失值
df.fillna(0, inplace=True)
# 删除重复行
df.drop_duplicates(inplace=True)
练习题4:如何转换数据类型?
import pandas as pd
# 将字符串转换为数字
df['age'] = df['age'].astype(int)
# 将数字转换为字符串
df['city'] = df['city'].astype(str)
练习题5:如何分组数据?
import pandas as pd
# 按列分组
df.groupby('city')
# 按多个列分组
df.groupby(['city', 'age'])
练习题6:如何聚合数据?
import pandas as pd
# 计算平均值
df.groupby('city').mean()
# 计算总和
df.groupby('city').sum()
# 计算计数
df.groupby('city').count()
练习题7:如何排序数据?
import pandas as pd
# 按列排序
df.sort_values('age', inplace=True)
# 按多个列排序
df.sort_values(['city', 'age'], inplace=True)
练习题8:如何输出数据?
import pandas as pd
# 输出到控制台
print(df)
# 输出到CSV文件
df.to_csv('data.csv', index=False)
# 输出到Excel文件
df.to_excel('data.xlsx', index=False)
希望这些练习题对您有所帮助。如果您有任何问题,欢迎随时留言。