热线电话:13121318867

登录
2019-02-26 阅读量: 826
从包含集合的pandas列转置和转换onehotencode

我想转置然后“一热编码”风格。例如,采用数据帧df

Col1 Col2

C {Apple, Orange, Banana}

A {Apple, Grape}

B {Banana}

我想转换它并得到:

DF

Col1 C A B

Apple 1 1 0

Orange 1 0 0

Banana 1 0 1

Grape 0 1 0

我怎样才能使用pandas / Sklearn实现这一目标?

解决办法:(假设Col1是你的索引):

from sklearn.preprocessing import MultiLabelBinarizer

mlb = MultiLabelBinarizer()

one_hot_encoded = pd.DataFrame(mlb.fit_transform(df['Col2']), columns=mlb.classes_, index=df.index)

one_hot_encoded.T

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子