加载实例数据集_CDA答疑社区

啊啊啊啊啊吖

2018-11-30 阅读量: 1061

加载实例数据集

我们从我们的 shell 启动一个 Python 解释器，然后加载 iris 和 digits 数据集。我们的符号约定是 $ 表示 shell 提示符，而 >>> 表示 Python 解释器提示符:

$ python
 >>> from sklearn import datasets 
>>> iris = datasets.load_iris() 
>>> digits = datasets.load_digits()

数据集是一个类似字典的对象，它保存有关数据的所有数据和一些元数据。该数据存储在 .data 成员中，它是 n_samples, n_features 数组。在监督问题的情况下，一个或多个响应变量存储在 .target 成员中。有关不同数据集的更多详细信息。

例如，在数字数据集的情况下，digits.data 使我们能够得到一些用于分类的样本特征:

>>>>>> print(digits.data) [[  0.   0.   5. ...,   0.   0.   0.]  [  0.   0.   0. ...,  10.   0.   0.]  [  0.   0.   0. ...,  16.   9.   0.]  ...,  [  0.   0.   1. ...,   6.   0.   0.]  [  0.   0.   2. ...,  12.   0.   0.]  [  0.   0.  10. ...,  12.   1.   0.]]

并且 digits.target 表示了数据集内每个数字的真实类别，也就是我们期望从每个手写数字图像中学得的相应的数字标记:

>>>>>> digits.target array([0, 1, 2, ..., 8, 9, 8])

0.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子