zxq997

2018-11-26   阅读量: 637

数据分析师

CRISP-DM

扫码加入数据分析学习群

1996年由SPSS和NCR等提出了一个数据挖掘跨行业标准过程,即CRISP-DM方法论(cross-industry process for data mining)。将数据挖掘项目生命周期分为6个阶段,它们分别是业务理解、数据理解、数据准备、建模、模型评估和模型发布。

上图呈现了通用数据挖掘方法论(CRISP-DM)流程的6个阶段。下面简短地介绍了每个阶段的要点。

(1)业务理解

该初始阶段集中在从商业角度理解项目的目标和要求,通过理论分析转化为数据挖掘可操作的问题,制定实现目标的初步计划。

(2)数据理解

数据理解阶段开始于原始数据的收集,然后是熟悉数据、标明数据质量问题、探索对数据的初步理解、发觉有趣的子集以形成对探索关系的假设。

(3)数据准备

数据准备阶段包括所有从原始的、未加工的数据构造数据挖掘所需信息的活动。数据准备任务可能被实施多次,而且没有任何规定的顺序。这些任务的主要目的是从源系统根据维度分析的要求,获取所需要的信息,需要对数据进行转换和清洗。

(4)建模

在此阶段,主要是选择和应用各种建模技术。同时对它们的参数进行校准,以达到最优值。通常对同一个数据挖掘问题类型,会有多种建模技术。一些技术对数据格式有特殊的要求。因此,常常需要返回到数据准备阶段。

(5)模型评估

在模型最后发布前,根据商业目标评估模型和检查建立模型的各个步骤。此阶段关键目的是判断是否存在一些重要的商业问题仍未得到充分考虑。

(6)模型发布

模型完成后,由模型使用者(客户)根据当时背景和目标完成情况,决定如何在现场使用模型。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子