2019-02-26
阅读量:
826
从包含集合的pandas列转置和转换onehotencode
我想转置然后“一热编码”风格。例如,采用数据帧df
Col1 Col2
C {Apple, Orange, Banana}
A {Apple, Grape}
B {Banana}
我想转换它并得到:
DF
Col1 C A B
Apple 1 1 0
Orange 1 0 0
Banana 1 0 1
Grape 0 1 0
我怎样才能使用pandas / Sklearn实现这一目标?
解决办法:(假设Col1是你的索引):
from sklearn.preprocessing import MultiLabelBinarizer
mlb = MultiLabelBinarizer()
one_hot_encoded = pd.DataFrame(mlb.fit_transform(df['Col2']), columns=mlb.classes_, index=df.index)
one_hot_encoded.T






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论