热线电话:13121318867

登录
2018-11-30 阅读量: 801
加载实例数据集

我们从我们的 shell 启动一个 Python 解释器,然后加载 irisdigits 数据集。我们的符号约定是 $ 表示 shell 提示符,而 >>> 表示 Python 解释器提示符:

$ python
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> digits = datasets.load_digits()

数据集是一个类似字典的对象,它保存有关数据的所有数据和一些元数据。 该数据存储在 .data 成员中,它是 n_samples, n_features 数组。 在监督问题的情况下,一个或多个响应变量存储在 .target 成员中。 有关不同数据集的更多详细信息。

例如,在数字数据集的情况下,digits.data 使我们能够得到一些用于分类的样本特征:

>>>>>> print(digits.data) [[  0.   0.   5. ...,   0.   0.   0.]  [  0.   0.   0. ...,  10.   0.   0.]  [  0.   0.   0. ...,  16.   9.   0.]  ...,  [  0.   0.   1. ...,   6.   0.   0.]  [  0.   0.   2. ...,  12.   0.   0.]  [  0.   0.  10. ...,  12.   1.   0.]] 

并且 digits.target 表示了数据集内每个数字的真实类别,也就是我们期望从每个手写数字图像中学得的相应的数字标记:

>>>>>> digits.target array([0, 1, 2, ..., 8, 9, 8])
0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子