返回

Python Pandas处理基础入门简单题汇总

后端

大家好,我是皮皮。

一、前言

前几天在Python星耀交流群【dcpeng】问了一个Pandas基础的问题,提问截图如下:

[图片]

原始代码如下:

import pandas as pd

df = pd.DataFrame({'name': ['John', 'Mary', 'Bob', 'Alice'],
                   'age': [20, 25, 30, 35],
                   'city': ['New York', 'London', 'Paris', 'Tokyo']})

# 练习题1:如何将name列的值设置为大写?
df['name'] = df['name'].str.upper()

# 练习题2:如何将age列的值增加5岁?
df['age'] = df['age'] + 5

# 练习题3:如何将city列的值全部替换为“Beijing”?
df['city'] = 'Beijing'

# 练习题4:如何将DataFrame中的所有值转换为字符串?
df = df.astype(str)

# 练习题5:如何将DataFrame中缺失的值替换为0?
df.fillna(0, inplace=True)

# 练习题6:如何将DataFrame中的重复行删除?
df.drop_duplicates(inplace=True)

# 练习题7:如何将DataFrame中的数据按照age列排序?
df.sort_values(by='age', inplace=True)

# 练习题8:如何将DataFrame中的前5行数据输出到控制台?
print(df.head(5))

这个题目还是有点难度的,感兴趣的话,大家也可以尝试下。

二、Pandas基础练习题汇总

下面是一些Pandas基础的练习题,旨在帮助您掌握Pandas的基本操作和用法。这些练习题涵盖了Pandas中各种常见的数据处理和分析任务,包括数据读取、数据清洗、数据转换、数据分组、数据聚合等。通过这些练习题,您可以逐步掌握Pandas的各种核心功能,并为更深入的数据分析奠定基础。

练习题1:如何创建一个DataFrame?

import pandas as pd

# 从字典中创建DataFrame
data = {'name': ['John', 'Mary', 'Bob', 'Alice'],
        'age': [20, 25, 30, 35],
        'city': ['New York', 'London', 'Paris', 'Tokyo']}

df = pd.DataFrame(data)

# 从列表中创建DataFrame
data = [['John', 20, 'New York'],
        ['Mary', 25, 'London'],
        ['Bob', 30, 'Paris'],
        ['Alice', 35, 'Tokyo']]

df = pd.DataFrame(data, columns=['name', 'age', 'city'])

练习题2:如何读取CSV文件中的数据?

import pandas as pd

# 从CSV文件中读取数据
df = pd.read_csv('data.csv')

练习题3:如何清洗数据?

import pandas as pd

# 删除缺失值
df.dropna(inplace=True)

# 替换缺失值
df.fillna(0, inplace=True)

# 删除重复行
df.drop_duplicates(inplace=True)

练习题4:如何转换数据类型?

import pandas as pd

# 将字符串转换为数字
df['age'] = df['age'].astype(int)

# 将数字转换为字符串
df['city'] = df['city'].astype(str)

练习题5:如何分组数据?

import pandas as pd

# 按列分组
df.groupby('city')

# 按多个列分组
df.groupby(['city', 'age'])

练习题6:如何聚合数据?

import pandas as pd

# 计算平均值
df.groupby('city').mean()

# 计算总和
df.groupby('city').sum()

# 计算计数
df.groupby('city').count()

练习题7:如何排序数据?

import pandas as pd

# 按列排序
df.sort_values('age', inplace=True)

# 按多个列排序
df.sort_values(['city', 'age'], inplace=True)

练习题8:如何输出数据?

import pandas as pd

# 输出到控制台
print(df)

# 输出到CSV文件
df.to_csv('data.csv', index=False)

# 输出到Excel文件
df.to_excel('data.xlsx', index=False)

希望这些练习题对您有所帮助。如果您有任何问题,欢迎随时留言。