热线电话:13121318867

登录
2019-01-20 阅读量: 2323
将pandas数据框中列的dtype对象更改为布尔值

使用Pandas分析从调查中获取的数据集。我有几个列是Yes或No答案。我想做什么以及我想问的问题:将dtype obj更改为boolean Yes = True,No = False。我还想知道是否有一种方法可以同时为多个列执行此操作。

0.0000
2
关注作者
收藏
评论(1)

发表评论
啊啊啊啊啊吖
2019-01-20
此处的问题是由于同一列中有不同的数字,模型会误解数据的某种顺序,0 <1 <2。但事实并非如此。为了解决这个问题,我们使用One Hot Encoder。 from sklearn.preprocessing import LabelEncoder, OneHotEncoder labelencoder_X_1 = LabelEncoder() X[:,1] = labelencoder_X_1.fit_transform(X[:,1]) labelencoder_X_2 = LabelEncoder() X[:,2] = labelencoder_X_2.fit_transform(X[:,2]) onehotencoder = OneHotEncoder(categorical_features = [1]) X = onehotencoder.fit_transform(X).toarray()
0.0000 0 0 回复