MST

星途 面试题库

面试题:Python的Pandas库如何进行复杂的数据分组与聚合

假设有一个销售数据集,包含产品名称、销售地区、销售额和销售日期等字段。要求使用Pandas库,按销售地区和产品名称分组,计算每个分组内销售额的总和、平均值以及销售日期的最早和最晚日期。请给出实现代码。
39.7万 热度难度
编程语言Python

知识考点

AI 面试

面试题答案

一键面试
import pandas as pd

# 假设数据存储在一个DataFrame中,名为df
# 这里未给出具体的读取数据方式,实际应用中可使用如pd.read_csv等方法读取数据
# 假设df已有'产品名称', '销售地区', '销售额', '销售日期'字段

result = df.groupby(['销售地区', '产品名称']).agg(
    销售额总和=('销售额','sum'),
    销售额平均值=('销售额','mean'),
    最早销售日期=('销售日期','min'),
    最晚销售日期=('销售日期','max')
).reset_index()

print(result)