詹惠儿

2020-09-17   阅读量: 797

Scikit-learn 机器学习

如何理解特种工程中的标签编码?

扫码加入数据分析学习群

问:

如何理解特种工程中的标签编码?


答:

标签编码中,我们可以将分类值转换为数字标签。假设以下是我们的数据集:

我们在“Country”列上使用标签重新编码,则会将India转换为1,将the USA转换为2,将China转换为0。此技术的缺点是,会将美国列为最高优先级,因为美国的标签是最大的,而中国则列为最低优先级的标签0,但这在实际工作中仍然是一种非常有用的技术。

让我们编写代码。

from sklearn.preprocessing import LabelEncoder

l1 = LabelEncoder()

l1.fit(catDf['Country'])

catDf.Country = l1.transform(catDf.Country)

print(catDf)

在这里,我们实例化了LabelEncoder对象,然后使用 fit 方法拟合我们的分类列,接着使用 transform 方法进行编码转换。

请注意,这里得到的是一个临时存储值 ,如果要永久保存该值,我们需要将结果赋值给原来的分类列,例如:

catDf ['Country'] = l1.transform(catDf['Country'])



添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
35.9124 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子