MST

星途 面试题库

面试题:Python中Pandas数据清洗之缺失值处理

假设你有一个Pandas的DataFrame,其中包含缺失值。请描述至少两种使用Pandas处理这些缺失值的方法,并给出相应的代码示例。
35.4万 热度难度
编程语言Python

知识考点

AI 面试

面试题答案

一键面试
  1. 删除缺失值
    • 使用dropna()方法可以删除包含缺失值的行或列。
    • 代码示例:
    import pandas as pd
    data = {'col1': [1, None, 3], 'col2': [4, 5, None]}
    df = pd.DataFrame(data)
    # 删除包含缺失值的行
    df_dropped_rows = df.dropna()
    # 删除包含缺失值的列
    df_dropped_cols = df.dropna(axis = 1)
    print("删除缺失值行后的DataFrame:\n", df_dropped_rows)
    print("删除缺失值列后的DataFrame:\n", df_dropped_cols)
    
  2. 填充缺失值
    • 使用fillna()方法可以用指定的值填充缺失值。
    • 代码示例:
    import pandas as pd
    data = {'col1': [1, None, 3], 'col2': [4, 5, None]}
    df = pd.DataFrame(data)
    # 用0填充缺失值
    df_filled_with_0 = df.fillna(0)
    # 用前一个值填充缺失值(向前填充)
    df_filled_ffill = df.fillna(method='ffill')
    print("用0填充缺失值后的DataFrame:\n", df_filled_with_0)
    print("向前填充缺失值后的DataFrame:\n", df_filled_ffill)