2020-04-29
阅读量:
991
多分类为什么编码转独热编码以后,变为二分类变量了?
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import onehotencoder
data = ["cold", "cold", "warm", "cold", "hot", "hot", "warm", "cold", "warm", "hot"]
data = pd.DataFrame(data)
data.columns = ["温度"]
label_encoder = LabelEncoder()
data["温度"] = label_encoder.fit_transform(data["温度"])

onehot_encoder = preprocessing.OneHotEncoder(sparse=False)
data["温度"] = onehot_encoder.fit_transform(data[["温度"]])

onehot_encoder转换后得到的是多行多列的结果

当赋值到data["温度"]一列中,结果只是提取了第一列的数据
可以将得到的结果放到DataFrame中,再指定字段名






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论