热线电话:13121318867

登录
2018-10-22 阅读量: 1129
分类任务解决流程有哪些(分类算法)?

1. 任务:以新闻分类为例

2. 特征表示:X={昨日,是,国内,投资,市场……}

3. 特征选择:X={国内,投资,市场……}

4. 模型选择:朴素贝叶斯分类器

• P(X):待分类对象自身的概率,可忽略

• P(yi):每个类别的先验概率,如P(军事)

• P(X|yi):每个类别产生该对象的概率

• P(xi|yi):每个类别产生该特征的概率,如P(苹果|科技)

5. 训练数据准备

根据最大似然估计(maximum likehood estimation,MLE):

P(yi)=Count(yi)/Count(*)

即:类别为yi的对象在训练数据中出现的次数/训练集样本总数

P(xj|yi)=Count(xj,yi)/Count(yi)

即:特征xj和类别yi在训练数据中同时出现的次数/Count(yi)

6. 模型训练进行预测分类

给定X,依据上面的贝叶斯公式,计算所有的p(yi|X):

• P(军事|X)=P(国内|军事)* P(投资|军事)* P(市场|军事)……P(军事)

• 同理,计算P(科技|X) P(生活|X)

选择概率值最大的yi作为输出

7. 评测

• 准确度 Accuracy:(50+35)/(35+5+10+50)=85%

• 精确率 Precision(y1):50/(50+5)=90.9%

• 召回率 Recall(y1):50/(50+10)=83.3%

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子