2020-03-02
阅读量:
734
数据预处理过程有哪些?
缺失值处理:删、插
异常值处理
特征转换:时间特征sin化表示
标准化:最大最小标准化、z标准化等
归一化:对于文本或评分特征,不同样本之间可能有整体上的差异,如a文本共20个词,b文本30000个词,b文本中各个维度上的频次都很可能远远高于a文本
离散化:onehot、分箱等






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论