热线电话:13121318867

登录
2021-03-09 阅读量: 478
sklearn的主要设计原则是什么

问:

sklearn的主要设计原则是什么


答:

主要的设计原则如下:
⼀致性:所有对象共享⼀个简单⼀致的界⾯(接⼝)。
估算器: fit()⽅法。基于数据估算参数的任意对象,使⽤的参数是⼀个数据集(对应X, 有监督算法还需要⼀个y),引导估算过程的任意其他参数称为超参数,必须被设置为实例变量。
转换器: transform()⽅法。使⽤估算器转换数据集,转换过程依赖于学习参数。可以 使⽤便捷⽅式: fit_transform(),相当于先fit()再transform()。 (fit_transform有时被优化过,速度更快)
预测器: predict()⽅法。使⽤估算器预测新数据,返回包含预测结果的数据,还有 score()⽅法:⽤于度量给定测试集的预测效果的好坏。 (连续y使⽤R⽅,分类y使⽤准确率accuracy)
监控:检查所有参数,所有估算器的超参数可以通过公共实例变量访问,所有估算器的学习参数都
可以通过有下划线后缀的公共实例变量访问。
防⽌类扩散:对象类型固定,数据集被表示为Numpy数组或Scipy稀疏矩阵,超参是普通的
Python字符或数字 。
合成:现有的构件尽可能重⽤,可以轻松创建⼀个流⽔线Pipeline。
合理默认值:⼤多数参数提供合理默认值,可以轻松搭建⼀个基本的⼯作系统。
Scikit-learn重视机器学习的逻辑性和系统性,所以有选择的忽略了某些算法中偏统计⽅ ⾯的逻辑和结果,
例如回归

105.5975
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子