MST
星途 面试题库

面试题:Python利用NumPy和Pandas处理复杂数据结构

有一个较大的CSV文件,其中包含多列数据,数据类型有数值型、字符串型等。要求使用Pandas读取该文件,并对数值列进行标准化处理(将数据转换为均值为0,标准差为1),同时提取出字符串列中长度大于5的字符串组成新的Series。如何用Python结合NumPy和Pandas实现?
18.3万 热度难度
编程语言Python

知识考点

AI 面试

面试题答案

一键面试
import pandas as pd
import numpy as np

# 读取CSV文件
data = pd.read_csv('your_file.csv')

# 分离数值列和字符串列
numeric_cols = data.select_dtypes(include=[np.number]).columns
string_cols = data.select_dtypes(include=[object]).columns

# 对数值列进行标准化处理
data[numeric_cols] = (data[numeric_cols] - data[numeric_cols].mean()) / data[numeric_cols].std()

# 提取字符串列中长度大于5的字符串组成新的Series
new_series = pd.Series()
for col in string_cols:
    new_series = pd.concat([new_series, data[col][data[col].str.len() > 5]])

print(data)
print(new_series)