詹惠儿
2021-04-08 阅读量: 23
问:
为什么需要对数值型的特征做归一化?哪些模型需要归一化?
答:
对数值型的特征进行归一化主要是为了统一不同特征的量纲,加快模型训练,减少迭代次数;
需要进行归一化的模型有:线性回归,逻辑回归,SVM, 神经网络,knn,kmeans。
问:MYSQL这样查是空的,逻辑有问题吗?答:where语句不对,and 后面要接逻辑条件,不是单值。
问:集成算法里的每个基需要做参数调优吗?每个基调优后出来的效果更好,最后整个模型的效果不是更好吗?答:这个想法很不错,方法可行。但是sklearn的模型,只能整体做调优,而不能单独的对每个做调优的。
问:模型参数优化之后,重新代入模型,得到的准确率为什么还没有没优化之前高答:图一时没有任何参数优化得到模型的分数,图二是进行参数优化后模型的分数,从图一可以看出,模型训练集分数明显高于测试集分数,存在过拟合风险,而图二反映的是模型的综合能力,优化后的模型降低了过拟合风险,测试集分数也有所提高了。
问:Sklearn中有对特征进行降维处理的方法吗? 答:sklearn中降维算法都被包括在模块decomposition中,这个模块本质是一个矩阵分解模块。矩阵分解可以用在降维,深度学习,聚类分析,数据预处理理,低纬度特征学习,推荐系统,大数据分析等领域。在sklearn 中调用的语法为: