热线电话:13121318867

登录
2020-04-30 阅读量: 4379
pandas读取数据空值处理,题目详情见正文

df表如下:

df表内包含特殊字符,读取df表是需要将特殊字符处理成空值形式,要求读取的数据结果如下:

参考代码:

list1 = [["第一分公司","第二分公司",]
,["销售部","市场部","行政部"]]
index = pd.MultiIndex.from_product(list1, names=['公司', '部门'])
df = pd.DataFrame({"姓名":["Allen","Lucy","Tom","Alice","Tim","Lily"],"工龄":np.random.randint(1,5,6)
,"入职日期":["2017-01-30","#","2019-07-21","2020-04-02","-","2017-05-12"]},index = index)
df
df.to_csv('num.csv',index=False)

df = pd.read_csv('num.csv',na_values=['#',"-"])
df

代码结果:

0.0000
3
关注作者
收藏
评论(1)

发表评论
yuechuchen
2020-04-30
解题思路:把特殊字符处理成空值,在读取数据时将指定字符打包到列表中传递给指定参数na_values即可,如果不进行改参数的设置,特殊字符会显示成特殊字符本身,以题目为例,如果不对“#”和“—”进行设置,在入职日期列会出现这两个字符,影响计算。
0.0000 0 0 回复
推荐帖子
条评论