2021-04-10
阅读量:
453
建立模型过程中进行特征筛选有哪些需要注意的点?
问:
建立模型过程中进行特征筛选有哪些需要注意的点?
答:
(1)方法
通过经验法从业务上判断变量重要性, 这样有助于与业务环境相契合, 不至于模型脱节
于业务,造成与同事、 老板的经验不一致。
(2)维度
维度分析的整体规律是从低维到多维。描述性统计侧重于单维分析,并通过图形过渡到
对双变量的处理, 将双维问题推广到多维,这是统计分析的一般性流程。
(3)变量重要性
业务导向和(第三步)相关分析都是通过业务准则判断变量重要性, 此处筛选出的变量
比较少,需要执行的时间很久;而第二步的简单回归和第四步的动态回归是,依回归系数检
验大幅删除变量的方式进行的,可以有效地节省时间。
第五步的主成分分析是一种压缩变量的技术,在压缩过程中会损失变量信息, 因此尽量
不要对重要变量压缩, 又因为压缩过程需要借助变量间的相关性, 所以不重要的变量间又很难产生这种相关, 通常也不会有理想的结果。
(4)共线性
特征选择本身具有处理内生性问题,选择合适的自变量,避免自变量和残差间的相关,
也正因为涉及到多个自变量, 共线性问题也是绕不开的话题, 因此加入对共线性的处理。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论