2018-11-30
阅读量:
801
加载实例数据集
我们从我们的 shell 启动一个 Python 解释器,然后加载 iris
和 digits
数据集。我们的符号约定是 $
表示 shell 提示符,而 >>>
表示 Python 解释器提示符:
$ python
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> digits = datasets.load_digits()
数据集是一个类似字典的对象,它保存有关数据的所有数据和一些元数据。 该数据存储在 .data
成员中,它是 n_samples,
n_features
数组。 在监督问题的情况下,一个或多个响应变量存储在 .target
成员中。 有关不同数据集的更多详细信息。
例如,在数字数据集的情况下,digits.data
使我们能够得到一些用于分类的样本特征:
>>>>>> print(digits.data) [[ 0. 0. 5. ..., 0. 0. 0.] [ 0. 0. 0. ..., 10. 0. 0.] [ 0. 0. 0. ..., 16. 9. 0.] ..., [ 0. 0. 1. ..., 6. 0. 0.] [ 0. 0. 2. ..., 12. 0. 0.] [ 0. 0. 10. ..., 12. 1. 0.]]
并且 digits.target
表示了数据集内每个数字的真实类别,也就是我们期望从每个手写数字图像中学得的相应的数字标记:
>>>>>> digits.target array([0, 1, 2, ..., 8, 9, 8])






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论