什么是机器学习?
专门研究计算机怎样模拟人类的学习行为,用获取到的新知识重新组织已有的知识结构,不断改善自身的性能
机器学习的分类:
监督学习(supervised learning)
无监督学习(unsupervised learning )
半监督学习(semi-supervised learning )
强化学习(reinforcement learning, 增强学习)
监督学习:训练模型时有样本对应的类别标签信息
泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律,
对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。(学习能力,不是背诵能力)
无监督学习:训练模型时没有样本对应的类别标签信息
半监督学习:训练数据有部分被标识, 部分没有被标识;思路见截图
强化学习:通过试错来发现最优行为策略而不是带有标签的样本学习。
在机器学习中, 要解决某一问题, 通常把问题转为成分类、回归、 聚类、 强化学习这四类问题进行解决
分类问题:根据数据样本抽取出的特征, 判定其属于有限个类别中的哪一个。(大多会产出一个概率值)
回归问题:根据样本上抽取的特征, 预测连续值结果。 属于有监督学习
聚类问题:根据数据样本抽取的特征, 挖掘出数据的关联模式
机 器 学 习 流 程 : 数 据 预 处 理 (Preprocessing ) 、 模 型 学 习(Learning) 、 模型评估(Evaluation) 、 新样本预测(Prediction)








暂无数据