MST

星途 面试题库

面试题:Python中Pandas时间序列数据分析的高级问题

给定一个包含不规则时间间隔的销售数据的Pandas DataFrame,其中有'sale_date'(时间戳格式)和'sale_amount'列。你需要进行以下操作:1. 将数据重采样到每月的最后一天,并计算每月的总销售额;2. 对重采样后的数据进行向前填充缺失值;3. 计算每个月销售额相对于前一个月的增长率。请用Python的Pandas库实现。
41.0万 热度难度
编程语言Python

知识考点

AI 面试

面试题答案

一键面试
import pandas as pd

# 假设已有DataFrame,df为包含'sale_date'(时间戳格式)和'sale_amount'列的DataFrame
# 1. 将数据重采样到每月的最后一天,并计算每月的总销售额
monthly_sales = df.set_index('sale_date').resample('M').sum()

# 2. 对重采样后的数据进行向前填充缺失值
monthly_sales.fillna(method='ffill', inplace=True)

# 3. 计算每个月销售额相对于前一个月的增长率
monthly_sales['growth_rate'] = monthly_sales['sale_amount'].pct_change()