2019-01-20
阅读量:
2323
将pandas数据框中列的dtype对象更改为布尔值
使用Pandas分析从调查中获取的数据集。我有几个列是Yes或No答案。我想做什么以及我想问的问题:将dtype obj更改为boolean Yes = True,No = False。我还想知道是否有一种方法可以同时为多个列执行此操作。






评论(1)


啊啊啊啊啊吖
2019-01-20
此处的问题是由于同一列中有不同的数字,模型会误解数据的某种顺序,0 <1 <2。但事实并非如此。为了解决这个问题,我们使用One Hot Encoder。
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X_1 = LabelEncoder()
X[:,1] = labelencoder_X_1.fit_transform(X[:,1])
labelencoder_X_2 = LabelEncoder()
X[:,2] = labelencoder_X_2.fit_transform(X[:,2])
onehotencoder = OneHotEncoder(categorical_features = [1])
X = onehotencoder.fit_transform(X).toarray()
0.0000
0
0
推荐帖子
0条评论
0条评论
0条评论