登录
首页精彩阅读数据挖掘中决策树算法的研究及探讨
数据挖掘中决策树算法的研究及探讨
2016-02-15
收藏

数据挖掘决策树算法的研究及探讨

随着计算机硬件和软件的飞速发展,尤其是数据库技术应用的日益普及,人们面临着快速扩张的数据海洋,如何有效的运用,成为我们信息工作者所关注的焦点,数据挖掘就是从大型数据库或数据仓库中挖掘出数据潜在的关联性。

数据挖掘分类法是指从大量的数据库中自动地、智能地抽取一些行之 有效的、可以相信的和理解的以及有用模式的过程。作为数据挖掘的重要内容之一的分类法,日前,分类已经被广泛运用于天气预测、顾客区分、医疗诊断、欺诈甄 别、信用证实当中。在数据挖掘的众多分类方法中,决策树算法在大量数据环境中应用的最为广泛。

数据库技术的迅速发展以及数据库管理系统的广泛应用,导致人们积累了越来越多的数据。巨增的数据背后蕴藏着丰富的知识,而目前的数据库技术虽可以高效地实现数据的查询、统计等功能,但却无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。数据库中存在着大量的数据,却缺乏挖掘数据背后隐藏的知识的手段,出现了"数据爆炸而知识贫乏"的现象。
     在此背景下,数据库知识发现(KDD) 及其核心技术-数据挖掘(DM) 便应运而生了。KDD 的研究内容是,能自动地去处理数据库中大量的原始数据,从中挖掘搜索出具有规律、富有意义的模式。它的发现过程主要有三个步骤:定义要发现的问题;根据问题进行数据搜索、模式抽取; 评价所发现的知识的好坏。三者之中,核心技术是第二步,即数据搜索及模式抽取方法。KDD = 问题处理+ DM+ 解释评价。由于问题处理和解释评价的研究较成熟,所以目前KDD的研究和实现难点重点都集中在核心的DM上。

数据分析咨询请扫描二维码

客服在线
立即咨询