二进制
由两个类组成的分类问题。二进制目标可以表示为多类问题,但只有两个标签。二元决策函数表示为1d数组。
在语义上,一个类通常被认为是“积极的”类。除非另有说明(例如在 评估指标中使用pos_label),我们认为类标签具有更大的值(数字或词典)作为正类:标签[0,1],1是正类; [1,2],2是正类; ['不','是'],'是'是正面的; ['不','是'],'不'是正面的。例如,这会影响decision_function的输出 。
请注意,从多类y或连续 采样的数据集y可能看起来是二进制的。
type_of_target 将为二进制输入返回'binary',或者仅存在一个类的类似数组。
连续
回归问题,其中每个样本的目标是有限浮点数,表示为浮点数(或有时是整数)的一维数组。
type_of_target 对于连续输入,将返回“连续”,但如果数据全部为整数,则将其标识为“多类”。
连续多输出
多输出连续
一个回归问题,其中每个样本的目标由n_outputs 输出组成,每个输出都是一个有限的浮点数,用于特定数据集中的固定int 。n_outputs > 1
连续多输出目标表示为多个 连续目标,水平堆叠成一个形状阵列。(n_samples, n_outputs)
type_of_target 将为连续多输出输入返回“连续多输出”,但如果数据全部为整数,则将其标识为“多类多输出”。
多类
由两个以上类组成的分类问题。多类目标可以表示为字符串或整数的1维数组。整数的2D列向量(即,在一个单一的输出多输出方面)也是可以接受的。
我们没有正式支持其他可订购的,可清洗的对象作为类标签,即使估计器在给定此类型的分类目标时可能正常工作。
对于半监督分类,未标记的样本应具有特殊标签-1 in y。
在sckit-learn中,支持二进制分类的所有估计器也支持多类分类,默认情况下使用One-vs-Rest。
A preprocessing.LabelEncoder有助于将多类目标规范化为整数。
type_of_target将为多类输入返回'multiclass'。用户可能还希望将“二进制”输入与“多类”相同地处理。
多类多输出
多输出多类
一个分类问题,其中每个样本的目标由n_outputs 输出组成 ,每个输出都是一个类标签,用于特定数据集中的固定int 。每个输出都有一组固定的可用类,每个样本都标有每个输出的类。输出可以是二进制或多类,并且在所有输出都是二进制的情况下,目标是 多标记。n_outputs > 1
多类多输出目标表示为多个 多类目标,水平堆叠成一个形状数组。(n_samples, n_outputs)
XXX:为简单起见,我们可能并不总是支持多类多输出的字符串类标签,应该使用整数类标签。
multioutput提供使用多个单输出估计器估计多输出问题的估计器。这可能无法完全解释不同输出之间的依赖关系,本地处理多输出情况的方法(例如决策树,最近邻居,神经网络)可能做得更好。
type_of_target 将为多类多输出输入返回'multiclass-multioutput'。
多标签
阿多类多输出目标,其中每个输出是 二进制。这可以表示为2d(密集)阵列或整数的稀疏矩阵,使得每列是单独的二进制目标,其中正标签用1表示,负标签通常是-1或0.不支持稀疏多标记目标到处都支持密集的多标记目标。
在语义上,多标记目标可以被认为是每个样本的一组标签。虽然不在内部使用, preprocessing.MultiLabelBinarizer但作为实用程序提供,以从集合表示的列表转换为2d数组或稀疏矩阵。对多类目标进行单热编码 preprocessing.LabelBinarizer会将其转化为多标记问题。
type_of_target 将为多标签输入返回'multilabel-indicator',无论是稀疏还是密集。
多输出
多输出
每个样本具有多个分类/回归标签的目标。请参阅多类多输出和连续多输出。我们目前不支持对混合分类和回归目标进行建模。








暂无数据