2018-10-22
阅读量:
1129
分类任务解决流程有哪些(分类算法)?
1. 任务:以新闻分类为例
2. 特征表示:X={昨日,是,国内,投资,市场……}
3. 特征选择:X={国内,投资,市场……}
4. 模型选择:朴素贝叶斯分类器

• P(X):待分类对象自身的概率,可忽略
• P(yi):每个类别的先验概率,如P(军事)
• P(X|yi):每个类别产生该对象的概率
• P(xi|yi):每个类别产生该特征的概率,如P(苹果|科技)
5. 训练数据准备
根据最大似然估计(maximum likehood estimation,MLE):
P(yi)=Count(yi)/Count(*)
即:类别为yi的对象在训练数据中出现的次数/训练集样本总数
P(xj|yi)=Count(xj,yi)/Count(yi)
即:特征xj和类别yi在训练数据中同时出现的次数/Count(yi)
6. 模型训练进行预测分类
给定X,依据上面的贝叶斯公式,计算所有的p(yi|X):
• P(军事|X)=P(国内|军事)* P(投资|军事)* P(市场|军事)……P(军事)
• 同理,计算P(科技|X) P(生活|X)
选择概率值最大的yi作为输出
7. 评测

• 准确度 Accuracy:(50+35)/(35+5+10+50)=85%
• 精确率 Precision(y1):50/(50+5)=90.9%
• 召回率 Recall(y1):50/(50+10)=83.3%






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论