MST

星途 面试题库

面试题:Python中Pandas处理时间序列数据

假设你有一个包含日期时间数据的Pandas DataFrame,日期格式为'YYYY - MM - DD HH:MM:SS',要求将其转换为以周为频率的时间序列数据,并计算每周的总和,该如何实现?
32.4万 热度难度
编程语言Python

知识考点

AI 面试

面试题答案

一键面试
  1. 首先导入必要的库:
import pandas as pd
  1. 假设df是包含日期时间数据的DataFrame,并且日期时间列名为'datetime_column'
# 将日期时间列转换为datetime类型
df['datetime_column'] = pd.to_datetime(df['datetime_column'])

# 设置日期时间列为索引
df.set_index('datetime_column', inplace=True)

# 按周频率重采样并计算总和
weekly_sum = df.resample('W').sum()

上述代码中:

  • 第一步使用pd.to_datetime将日期时间列转换为datetime类型,确保后续操作能正确识别时间。
  • 第二步使用set_index将日期时间列设置为DataFrame的索引,以便进行基于时间的重采样操作。
  • 第三步使用resample方法按周频率('W')对数据进行重采样,并使用sum方法计算每周的总和。