问:
怎么理解LogisticRegression 的正则化项参数 penalty 啊?
class sklearn.linear_model.LogisticRegression (penalty=’l2’, dual=False, tol=0.0001, C=1.0,
fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver=’warn’,
max_iter=100, multi_class=’warn’, verbose=0, warm_start=False, n_jobs=None)
答:
LogisticRegression默认就带了正则化项。 penalty参数可选择的值为 "l1"和 "l2",分别对应L1的正则化
和L2的正则化,默认是L2的正则化。在调参时如果我们主要的⽬的只是为了解决过拟合,⼀般penalty选
择L2正则化就够了。但是如果选择L2正则化发现还是过拟合,即预测效果差的时候,就可以考虑L1正则化。
另外,如果模型的特征⾮常多,我们希望⼀些不重要的特征系数归零,从⽽让模型系数稀疏化的话,也可
以使⽤L1正则化。