2020-09-17
阅读量:
989
如何理解特种工程中的标签编码?
问:
如何理解特种工程中的标签编码?
答:
在标签编码中,我们可以将分类值转换为数字标签。假设以下是我们的数据集:
我们在“Country”列上使用标签重新编码,则会将India转换为1,将the USA转换为2,将China转换为0。此技术的缺点是,会将美国列为最高优先级,因为美国的标签是最大的,而中国则列为最低优先级的标签0,但这在实际工作中仍然是一种非常有用的技术。
让我们编写代码。
from sklearn.preprocessing import LabelEncoder
l1 = LabelEncoder()
l1.fit(catDf['Country'])
catDf.Country = l1.transform(catDf.Country)
print(catDf)
在这里,我们实例化了LabelEncoder对象,然后使用 fit 方法拟合我们的分类列,接着使用 transform 方法进行编码转换。
请注意,这里得到的是一个临时存储值 ,如果要永久保存该值,我们需要将结果赋值给原来的分类列,例如:
catDf ['Country'] = l1.transform(catDf['Country'])






评论(0)


暂无数据
推荐帖子
0条评论
0条评论