shauna570392

2020-02-18   阅读量: 1409

Python数据分析

predict_proba函数的返回值

扫码加入数据分析学习群

该函数很容易与predict函数的用法混淆

       predict_proba返回的是一个 n 行 k 列的数组第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。

举例

from
sklearn.linear_model import LogisticRegression
import numpy as np
x_train = np.array([[1,2,3],
[
1,3,4],
[
2,1,2],
[
4,5,6],
[
3,5,3],
[
1,7,2]])
y_train = np.array([0, 0, 0, 1, 1, 1])
x_test = np.array([[2,2,2],
[
3,2,6],
[
1,7,4]])
clf = LogisticRegression()
clf.fit(x_train, y_train)
# 返回预测标签

clf.predict(x_test)
array([
1, 0, 1])
# 返回预测属于某标签的概率

clf.predict_proba(x_test)
array([[
0.43348191, 0.56651809],
[
0.84401838, 0.15598162],
[
0.13147498, 0.86852502]])
预测[
2,2,2]的标签是0的概率为0.43348191,1的概率为0.56651809

预测[
3,2,6]的标签是0的概率为0.84401838,1的概率为0.15598162

预测[
1,7,4]的标签是0的概率为0.13147498,1的概率为0.86852502

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
27.2492 1 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子