面试题答案
一键面试- 识别缺失数据的方法:
isnull()
方法:isnull()
函数用于检测DataFrame中的缺失值。它会返回一个与原始DataFrame相同形状的DataFrame,其中每个元素都是布尔值,True
表示对应位置的元素是缺失值,False
表示不是缺失值。 示例代码:import pandas as pd data = {'col1': [1, None, 3], 'col2': [4, 5, None]} df = pd.DataFrame(data) missing_values = df.isnull() print(missing_values)
notnull()
方法:notnull()
函数与isnull()
相反,用于检测DataFrame中的非缺失值。它同样返回一个与原始DataFrame相同形状的DataFrame,其中每个元素都是布尔值,True
表示对应位置的元素不是缺失值,False
表示是缺失值。 示例代码:import pandas as pd data = {'col1': [1, None, 3], 'col2': [4, 5, None]} df = pd.DataFrame(data) non_missing_values = df.notnull() print(non_missing_values)
- 删除包含缺失数据的行:
使用
dropna()
方法可以删除包含缺失数据的行。 示例代码:
在import pandas as pd data = {'col1': [1, None, 3], 'col2': [4, 5, None]} df = pd.DataFrame(data) new_df = df.dropna() print(new_df)
dropna()
方法中,如果不传入任何参数,默认删除任何包含缺失值的行。也可以通过设置how='all'
来仅删除所有列值都为缺失值的行,例如:new_df_all = df.dropna(how='all') print(new_df_all)