2020-04-08
阅读量:
522
特征是时间的怎么处理?
时间本身的特征
- 如:用户在购买网站上的浏览、购买、收藏的时间;产品在购物网站上的上线时间;顾客在银行的存款和借款时间等。
- 形式:日期、时间戳等。
- 方法:将时间变量作为类别变量处理。
时间变量之间的组合特征
- 如:计算产品上线到现在经过了多长时间;顾客上次借款距离现在的时间间隔;两个时间间隔之间是否包含节假日或其他特殊日期等。
- 方法:根据两个或多个时间变量的含义,进行特征组合。
时间序列相关特征
- 如:股票价格;天气温度;降雨量;订单量等。
- 目的:基于历史数据预测未来信息。
- 方法:滞后特征、滑动窗口统计特征。
- - 滞后特征:时间序列预测问题转化为监督学习问题的一种经典方法。
- - 滑动窗口统计特征例如计算前n个值的均值或者前n个值中每个类别的分布。时间窗口的选取可以有多种方式,滞后特征是滑动窗口统计的一种特例,对应时间窗口宽度是1.另一种常用的窗口设置包含所有历史数据,成为扩展窗口统计。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论