sklearn的主要设计原则是什么

詹惠儿

2021-03-09 阅读量: 688

sklearn的主要设计原则是什么

问：

sklearn的主要设计原则是什么

答：

主要的设计原则如下:
⼀致性：所有对象共享⼀个简单⼀致的界⾯(接⼝)。
估算器： fit()⽅法。基于数据估算参数的任意对象，使⽤的参数是⼀个数据集(对应X, 有监督算法还需要⼀个y)，引导估算过程的任意其他参数称为超参数，必须被设置为实例变量。
转换器： transform()⽅法。使⽤估算器转换数据集，转换过程依赖于学习参数。可以使⽤便捷⽅式： fit_transform()，相当于先fit()再transform()。 (fit_transform有时被优化过，速度更快)
预测器： predict()⽅法。使⽤估算器预测新数据，返回包含预测结果的数据，还有 score()⽅法：⽤于度量给定测试集的预测效果的好坏。 (连续y使⽤R⽅,分类y使⽤准确率accuracy)
监控：检查所有参数，所有估算器的超参数可以通过公共实例变量访问，所有估算器的学习参数都
可以通过有下划线后缀的公共实例变量访问。
防⽌类扩散：对象类型固定，数据集被表示为Numpy数组或Scipy稀疏矩阵，超参是普通的
Python字符或数字。
合成：现有的构件尽可能重⽤，可以轻松创建⼀个流⽔线Pipeline。
合理默认值：⼤多数参数提供合理默认值，可以轻松搭建⼀个基本的⼯作系统。
Scikit-learn重视机器学习的逻辑性和系统性,所以有选择的忽略了某些算法中偏统计⽅⾯的逻辑和结果,
例如回归

105.5975

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子