啊啊啊啊啊吖

2018-11-30   阅读量: 622

数据分析师 机器学习 数据挖掘

加载实例数据集

扫码加入数据分析学习群

我们从我们的 shell 启动一个 Python 解释器,然后加载 irisdigits 数据集。我们的符号约定是 $ 表示 shell 提示符,而 >>> 表示 Python 解释器提示符:

$ python
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> digits = datasets.load_digits()

数据集是一个类似字典的对象,它保存有关数据的所有数据和一些元数据。 该数据存储在 .data 成员中,它是 n_samples, n_features 数组。 在监督问题的情况下,一个或多个响应变量存储在 .target 成员中。 有关不同数据集的更多详细信息。

例如,在数字数据集的情况下,digits.data 使我们能够得到一些用于分类的样本特征:

>>>>>> print(digits.data) [[  0.   0.   5. ...,   0.   0.   0.]  [  0.   0.   0. ...,  10.   0.   0.]  [  0.   0.   0. ...,  16.   9.   0.]  ...,  [  0.   0.   1. ...,   6.   0.   0.]  [  0.   0.   2. ...,  12.   0.   0.]  [  0.   0.  10. ...,  12.   1.   0.]] 

并且 digits.target 表示了数据集内每个数字的真实类别,也就是我们期望从每个手写数字图像中学得的相应的数字标记:

>>>>>> digits.target array([0, 1, 2, ..., 8, 9, 8])
添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子