京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据挖掘技术在采购循环控制中的应用
在信息化时代,传统的查询、分析功能已不能满足用户对海量信息的管理需求。若不采用新的先进技术,就很难找出数据中隐藏的关系和规律。很难根据目前的状况预测未来的发展趋势。使之为辅助决策提供支持。在这种情况下,数据挖掘技术应运而生。在ERP管理系统中,常用的数据挖掘策略包括分类、估计、预测、无指导聚类、购物篮分析等:常用的数据挖掘技术有统计方法、聚类分析、决策树和决策规则、关联规则、人工神经网络、遗传算法、可视化方法等。在数据挖掘实践中,往往是多种数据挖掘策略和技术方法综合运用。本文以ERP采购管理系统中的成本考核控制模块为例,介绍数据挖掘技术应用的过程。
一、采购管理系统控制流程
采购与付款循环是企业资金周转的重要环节,只有及时做好财产物资的供应与验收,才能保证生产和销售的正常运转,因此必须加强对采购循环的控制。
数据挖掘下的采购循环控制流程如下:申购员根据物料需求计划和仓库储备情况填写请购单,经主管部门领导审批后由采购员寻找供应商,经过比价协商,与供应商审核并签订采购订单。在确定了采购政策之后。材料送到仓管部门验收入库,根据上游单据生成到货单、人库单和采购发票,及时结算并传递给存货核算系统记账、制单,确认商品采购成本。另外,经采购系统结算后的发票传递到资金控制予系统中,由应付会计审核、制单,确保资金合理使用。遵循上述流程,可以将财务实时控制的方法和数据挖掘技术嵌人到ERP采购管理系统中,把存货的实际成本与计划成本比较,确定是超支还是节约。为考核采购员的工作业绩提供量化资料。通过Internet搜集和分析供应商的财务信息和经营状况,制定供应商的新政策,选择物美价廉、性价比高的材料和优质的服务。避免企业财务危机、维护企业信誉。
二、数据挖掘技术在采购循环控制中的应用
分类策略的主要方法之一是决策树方法。根据材料的计划成本和实际成本属性,通过决策树将材料分类,构建材料采购成本风险控制的数据模型,在应用中反复修正,提高采购业绩考核的准确性。然后,对所有材料采购成本进行聚类分析,可以将材料分为若干类,并对不同种类的材料分别采取不同的采购管理政策。例如,对于超支严重的材料进行历次购买行为分析,识别孤立点,当采购行为发生异常时,提示警报,以便深入研究其原因,采取措施。具体过程如下:
(一)问题陈述。对材料采购成本进行数据挖掘的目的是控制材料采购风险、降低采购成本,以便采取不同的材料供应战略。所以,此次数据挖掘的策略是根据材料采购超支与节约信息对材料进行分类,构建材料采购的分类模型。
(二)数据收集。要尽可能搜集到所有采购材料的属性值信息,提供海量的数据,将这些数据整合,形成数据集集市,供数据挖掘使用。
(三)数据预处理。如果将全部数据都拿来做数据挖掘,可能失去控制重点,还可能使错误数据影响数据挖掘,导致无法提练出有用的信息。因此,要经过下列数据预处理过程。(1)依据经验去除明显的异常点。(2)考虑材料采购风险的性质,剔除与数据挖掘主题无关的属性,确定恰当的材料采购描述属性。(3)依据挖掘的需求对数据进行相应的转换。在材料采购成本的数据挖掘中,主要的采购材料属性是供应商名称、仓库名称、材料名称、材料类别、数量、计划单价、实际单价、计划成本、实际成本、超支(节约)差异等等。表1为某企业部分材料采购成本表,已经过数据预处理。先根据材料采购成本的属性对采购业绩考核的重要性,选择材料的实际成本、超支(节约)差异属性作为分类的依据。然后,为了降低材料采购成本的量度影响。对上述两个属性归一化到0和l之间。公式为:归一化值=属性/属性中最大值。
表l
(四)模型评估。建立挖掘算法的模型是数据挖掘工作的重要环节。可以使用多种方法分别操作数据集,评估各模型的效果,从而寻找出合适的分析模型。在材料采购成本的数据挖掘中,可以运用分类树方法建立分类决策树,也可以采用聚类分析方法,以材料的实际成本和超支(节约)差异为属性将材料成本分为几类。此分类结果,可用于新增材料成本的分类。实现控制的程序化和自动化。
通过SPSS软件的聚类分析工具。使用K均值分类法处理上表的数据。按照设定的分类数目,从随机的初始分区开始,依据样本和类间的相似程度,将样本分配到各类,使之满足相应的收敛准则。过程如下:根据类中心的距离最小原则,把各项目分配到各类中去。产生第1次迭代的K类。根据每类的各项目计算其属性均值,产生第2次迭代的类中心。依次类推,反复迭代,直到达到规定的迭代标准或迭代次数为止。本例K均值分类法选定的类中心数为4,分类属性为归一化材料实际成本和归一化材料超支(节约)差异。经过3次迭代。得到聚类结果,如表2和表3所示。
表2 最终聚类中心
表3 最终聚类结果
(五)解释模型和得出结论。通过对数据挖掘构建的模型进行解释和评价,从大量的、随机的、模糊的、有噪声的实际数据中,提炼出有用的信息和知识,并以用户可理解的语言或可视化的形式呈现给用户。利用数据挖掘获取的信息,分析过去的交易和事项,也为未来的经济业务事项提供决策依据。当出现新交易和事项时,要分析和评价模型的适用性。或适当地修改模型。
从最终聚类中心来看,第1类是超支严重,实际成本较高的材料。该类材料应重点关注。可能是采购成本控制不到位,或者是原来制定的计划成本不合理,大大低于市场价。要深入分析原因,采取对策,若是采购人员的工作过失,耍责其改正,严重的要追究责任,使采购成本控制在合理的范围。第2类是超支较严重,实际成本不定的材料,应给予一定的关注,寻找降低采购成本的方法和途径,尽量做到不超支。第3类是既没超支也没节约,实际采购成本相对较为合理的材料。这类材料采购成本控制压力较小,可以减少关注程度。第4类是实际成本小于计划成本。实际成本不定的材料。这类材料采购成本控制工作做得好,应表彰奖励采购人员。总结推广经验。但要注意防止购买价低质次的材料。经过上述聚类分析。将材料采购成本分为4类,分别采取不同的措施。提高了材料采购成本的控制效率。减少了控制的随意性和采购风险。
上述五个阶段紧密相联,一环扣一环,相互作用,各个阶段都有新的方法和信息注入。
三、结束语
将数据挖掘技术用于采购成本控制分析。是挖掘ERP系统应用潜力、控制采购成本和采购风险、提高采购管理水平的有益探索。而且,数据挖掘还可以扩展到采购管理子系统其他方面以及财务管理、销售管理、生产制造、人力资源管理等ERP子系统中。形成一个基于数据挖掘的功能更强大的ERP系统。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22