詹惠儿

2018-11-06   阅读量: 794

数据分析师 机器学习 数据挖掘

简单理解机器学习

扫码加入数据分析学习群

机器学习概述

机器学习(ML)是一种算法类别,它允许软件应用程序在未经明确编程的情况下更准确地预测结果。机器学习的基本前提是构建可以接收输入数据的算法,并使用统计分析预测输出,同时在新数据可用时更新输出。

机器学习中涉及的过程类似于数据挖掘预测建模。两者都需要搜索数据以查找模式并相应地调整程序操作。许多人都熟悉通过互联网购物和提供与购买相关的广告的机器学习。这是因为推荐引擎使用机器学习几乎实时地个性化在线广告投放。除了个性化营销之外,其他常见的机器学习用例包括欺诈检测,垃圾邮件过滤,网络安全威胁检测,预测性维护和构建新闻源。

机器学习如何运作

机器学习算法通常被分类为监督无监督。监督算法要求具有机器学习技能的数据科学家或数据分析师提供输入和期望输出,此外还提供关于算法训练期间预测准确性的反馈。数据科学家确定模型应分析和使用哪些变量或特征来开发预测。培训完成后,算法将学到的内容应用于新数据。

无监督算法不需要用期望的结果数据进行训练。相反,他们使用称为深度学习的迭代方法来审查数据并得出结论。无监督学习算法 - 也称为神经网络 - 用于比监督学习系统更复杂的处理任务,包括图像识别,语音到文本和自然语言生成。这些神经网络通过梳理数百万个训练数据示例并自动识别许多变量之间经常微妙的相关性来工作。一旦经过训练,算法就可以使用其关联组来解释新数据。这些算法在大数据时代才变得可行,因为它们需要大量的训练数据。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
269.7471 1 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子