京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA数据分析研究院出品,转载需授权
从广义上讲,人工智能涉及机器做一些只有人才能做到的事情。也就是说,计算机科学家不同意几年前的某些计算能力是否可以构成人工智能。如今,许多这些功能可能仅仅只被称为软件。
人工智能的现代复兴是由一种非常特殊的计算方式的进步推动的:也就是机器学习。我们经常在Emerj上交替使用人工智能和机器学习,但许多计算机科学家喜欢将两者分开。关于人工智能的究竟是由什么构成的,在该领域存在(并且可能永远存在)辩论。一些计算机科学家不考虑人工智能的计算能力,除非它们涉及机器学习。
这些科学家可能会继续改变他们的人工智能参数,直到实现人工一般智能(AGI)。AGI的发展(计算机执行人类所能执行的任何智力任务的能力)是许多计算机科学研究人员的目标,但实现它可能需要很多年,并且它值得在其他的时间用专门的一篇文章来形容。
研究人员似乎同意的一点是机器学习在某种程度上属于人工智能的范畴,而人工智能本身属于计算机科学学科。深度学习是后续文章的主题,并且深度学习是机器学习的一个子集。这一概念由NVIDIA提出,解释如下:
Yoshua Bengio,过去二十年来最杰出的深度学习研究者之一,为我们提供了他自己对机器学习的定义:
机器学习研究是人工智能研究的一部分,旨在通过数据,观察和与世界的互动为计算机提供知识。获得的知识允许计算机正确地推广到新设置。
尽管机器学习在今天的人工智能思想的主导地位,但人工智能曾经以一种截然不同的方式被研究。
专家系统和人工智能的早期方法
在21世纪末和2010年初的机器学习取得进步之前,人工智能的兴趣围绕着一个完全独立的计算能力。在60年代和70年代,专家系统主导了人工智能的开发。开发人员试图通过将其概念化为一系列if-then语句来模仿人类思想和决策。实质上,专家系统是一个由if-then场景构建的大型网络,通过该场景过滤查询以实现一些预编程的最终结果。专家系统背后的if-then语句被硬编码到软件中。因此,AI每次都会以相同的方式响应某些输入。
如果所得到的软件在工业中具有任何实际用途,那么这些if-then场景需要适当地通知领域专家。例如,为了建立一个专家系统来了解当出现某种传染病时应该做些什么,开发人员需要以某种方式将软件的if-then场景建立在传染病专家在传染病时可能做的事情的基础上 。
例如,开发人员可以采访40位不同的传染病医疗专家,并向他们询问有关症状和治疗的一系列问题,并将他们的反应硬编码到专家系统中。这需要软件开发人员进行大量的深谋远虑和规划。他们需要与领域专家合作,列出某人可能询问某个特定主题的所有可能问题,然后找出这些问题的所有可能的答案。如果他们没不能解释一个问题或答案,那么专家系统将无法提供用户问题的准确答案。
另一个例子可能涉及客户支持票。专家系统可以建立在以下if-then场景上:“如果电子邮件的正文中包含”退款“字样,则将票证路由到退款票据桶。”这当然看起来是一个合理的规则,它确实可能会将大部分退款票据路由到相应的桶中。该规则不考虑客户谈论与退款相关的概念或使用退款相关短语而不使用“退款”一词的支持票。
客户可能会说,“如果你不给我回电话,我就会打电话给我的银行。”一个有业务背景的人力支持代理可能知道这样的门票通常涉及到客户不知道他们账户的费用是他们注册的年度订阅服务。代理商可能也知道,在几乎所有情况下,客户都希望退还该费用。基于专家系统的软件永远无法将这些票据退还到退款桶中。
专家系统的局限性
从理论上讲,具有业务“客户支持票证背景”的人员可以在构建专家系统之前将有关此场景的信息传递给构建专家系统的开发人员。if-then规则可能类似于“如果电子邮件的正文包含'bank'一词,则将票证路由到退款票据桶。”
但是,如果该企业最近才开始销售其订购服务,那么其基于专家系统的客户支持软件将无法适应进入系统的各种票证,并对其订阅服务进行模糊引用,例如上面的示例。在业务联系开发人员以使用另一个if-then规则更新软件之前,这些票证不会被路由到退款桶中。
围绕这一限制进行工作明显是不切实际的,这也是专家系统(以及通常的人工智能)在一段被称为“人工智能寒冬”的时期内衰退的最大原因。
随着互联网的出现,从在线购物到保险理赔的大量数据都变得数字化。数据现在已成为常态,即使是最小的公司也将数据存储在数字格式中。
机器学习是一种让计算机以与专家系统完全不同的方式模仿人类思想和决策的方式。如果一个人有能力存储,访问和理解他们可以做出决策的大脑中的数十亿个数据点,他们可能会做出与我们现在做出决策的方式截然不同的决策; 在任何情况下,在绝大多数情况下,对更多信息和背景做出的决定优于在较少信息和较少背景下进行的决策。
简而言之,机器学习模型可以对数十亿个数据点做出决策。它们理解这些数据,并将其转化为可能性,为它们的产出提供动力。这与专家系统非常不同,专家系统每个if-then规则只有一个输出,每个“if”只有一个“then”。更重要的是,机器学习模型是为了适应新的意外的输入而构建的。专家系统不知道如何处理不属于退款票规则的退票,但随着时间的推移,机器学习模型可以开始将“我正在给我的银行打电话”路由到退款桶中,作为回应人的反馈。
机器学习的适应性
如果人员在其路由正确或不正确时向模型指示,那么它可以使用该反馈来通知其基于其票证路由的可能性。虽然我们建议不要将人工智能拟人化,但它本身会问自己“这张票应该被送到退款桶的可能性是多少?”每当提供支持票时。如果确定可能性很高,则票证将被路由到退款桶。如果确定可能性较低,则可以对模型进行编程以标记票据以供人工审查。
这种适应性是机器学习和专家系统之间的关键差异,这就是为什么一些计算机科学家不再考虑专家系统和人工智能的其他计算能力的原因。它也是斯坦福定义机器学习的基础:“让计算机在没有明确编程的情况下采取行动的科学。”
这种适应性的一个例子是Netflix的推荐引擎。当平台上的新用户第一次从俄克拉荷马州的某个位置登录时,推荐引擎除了用户的IP位置之外几乎没有任何关于该用户的数据。但是,Netflix确实有几百万个数据点来自于俄克拉荷马州的其他用户。推荐引擎可以使用该数据来基于过去与类似用户的交互来做出关于该新用户可能想要看到什么内容的一般假设。
当用户继续与Netflix交互时,他们选择观看的数据,当他们暂停这些节目或完全停止观看时,以及显示他们连续观看的数据通知机器学习模型推荐给用户可能喜欢的节目。该模型响应用户的交互并适应他们的偏好。用户的数据还为其他用户提供了推荐,这些用户具有第一个用户相似的偏好和相似的人口统计学特征。
机器学习的核心是在大量数据上进行训练机器,使机器能够识别数据中的模式,从而确定使用特定输出而获得成功的可能性。
机器学习的局限性
机器学习有其局限性,事实上,当涉及到一个核心概念时,它比专家系统更糟糕:那就是可解释性。
我们可以遵循一系列if-then规则来弄清楚专家系统是如何产生特定输出的。如果结果证明他们的答案”then“是不正确的,那么就允许开发人员修复这些规则。专家系统是高度透明的,这在某些领域甚至是必要的,这是有帮助的。
如果患者询问他们的医生为什么他们诊断患有疾病,医生如果根据专家系统的输出做出诊断,那么医生可以回答这个问题。从理论上讲,他们可以通过专家系统的if-then规则读取导致其输出的信息,以及患者的诊断结果。
机器学习模型不是这种情况,它比if-then树复杂得多。机器学习模型背后的神经网络可能如下所示:
这是华威大学的典型的drop-net神经网络
如果医生根据机器学习模型的输出进行诊断,他们将无法向患者解释清楚。机器学习模型基于在数据集中自行构建的模式进行输出。人类在没有任何上下文的情况下为机器学习算法提供数据,并且该算法提供了一些基于人类目前无法识别的模式来确定结果。
机器学习模型可以基于任意数量的数据点为患者进行诊断。这可能是因为患者的CT扫描异常。也可能是因为他们的人口统计学特征,他们的名字,以及他们的保险索赔历史,比其他人更容易被诊断出患有特定疾病。医生既无法确认也无法否认。
这个问题也就是所谓的人工智能的“黑匣子”。机器学习模型可以通过以人类无法达到的规模查找数据模式来进行预测和推荐,但没有人能够解释模型如何或为何做出这些预测和建议。没有透明度,这是某些行业的一个主要问题,正如我们在报告中讨论的那样,在B2B和B2C中应用人工智能 - 有什么区别?对于计算机科学研究人员而言,黑匣子是一个令人担忧的问题,被称为“人工智能教父”的杰弗里·辛顿甚至建议“把它扔掉,然后再重新开始”。
商业领袖的经验
绝大多数商业领袖可能会考虑的人工智能解决方案,我们在Emerj所涵盖的确实是机器学习解决方案。商业领袖可以在谈话中使用人工智能,并希望他们的数据科学家能够理解他们所指的是机器学习。从历史的角度来看,专家系统通常被认为是人工智能,但是在80年代末期之前开发的计算能力通常不是人们在谈论人工智能时所指的。
有可能在未来十年或二十年内,机器学习本身将面临类似的命运,被归纳为计算机科学史的范畴,作为一种计算能力,它在当时发挥了应有的作用,但最终让位于某种更复杂,或许更具解释性的东西。再或者,机器学习可能不会被抛弃,而是变得无处不在,以至于它不再被称为人工智能。
商业领袖可以将专家系统和机器学习视为人工智能频谱的两端。现在,开发人员在开始构建人工智能解决方案时,通常不会构建专家系统; 他们建立机器学习模型。是实现人工智能相同目标的两种截然不同的方法:让计算机完成传统上为人类保留的智力任务。机器学习和专家系统是人工智能的子集,它是整个计算机科学的一个子集。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05