
数据挖掘技术在采购循环控制中的应用
在信息化时代,传统的查询、分析功能已不能满足用户对海量信息的管理需求。若不采用新的先进技术,就很难找出数据中隐藏的关系和规律。很难根据目前的状况预测未来的发展趋势。使之为辅助决策提供支持。在这种情况下,数据挖掘技术应运而生。在ERP管理系统中,常用的数据挖掘策略包括分类、估计、预测、无指导聚类、购物篮分析等:常用的数据挖掘技术有统计方法、聚类分析、决策树和决策规则、关联规则、人工神经网络、遗传算法、可视化方法等。在数据挖掘实践中,往往是多种数据挖掘策略和技术方法综合运用。本文以ERP采购管理系统中的成本考核控制模块为例,介绍数据挖掘技术应用的过程。
一、采购管理系统控制流程
采购与付款循环是企业资金周转的重要环节,只有及时做好财产物资的供应与验收,才能保证生产和销售的正常运转,因此必须加强对采购循环的控制。
数据挖掘下的采购循环控制流程如下:申购员根据物料需求计划和仓库储备情况填写请购单,经主管部门领导审批后由采购员寻找供应商,经过比价协商,与供应商审核并签订采购订单。在确定了采购政策之后。材料送到仓管部门验收入库,根据上游单据生成到货单、人库单和采购发票,及时结算并传递给存货核算系统记账、制单,确认商品采购成本。另外,经采购系统结算后的发票传递到资金控制予系统中,由应付会计审核、制单,确保资金合理使用。遵循上述流程,可以将财务实时控制的方法和数据挖掘技术嵌人到ERP采购管理系统中,把存货的实际成本与计划成本比较,确定是超支还是节约。为考核采购员的工作业绩提供量化资料。通过Internet搜集和分析供应商的财务信息和经营状况,制定供应商的新政策,选择物美价廉、性价比高的材料和优质的服务。避免企业财务危机、维护企业信誉。
二、数据挖掘技术在采购循环控制中的应用
分类策略的主要方法之一是决策树方法。根据材料的计划成本和实际成本属性,通过决策树将材料分类,构建材料采购成本风险控制的数据模型,在应用中反复修正,提高采购业绩考核的准确性。然后,对所有材料采购成本进行聚类分析,可以将材料分为若干类,并对不同种类的材料分别采取不同的采购管理政策。例如,对于超支严重的材料进行历次购买行为分析,识别孤立点,当采购行为发生异常时,提示警报,以便深入研究其原因,采取措施。具体过程如下:
(一)问题陈述。对材料采购成本进行数据挖掘的目的是控制材料采购风险、降低采购成本,以便采取不同的材料供应战略。所以,此次数据挖掘的策略是根据材料采购超支与节约信息对材料进行分类,构建材料采购的分类模型。
(二)数据收集。要尽可能搜集到所有采购材料的属性值信息,提供海量的数据,将这些数据整合,形成数据集集市,供数据挖掘使用。
(三)数据预处理。如果将全部数据都拿来做数据挖掘,可能失去控制重点,还可能使错误数据影响数据挖掘,导致无法提练出有用的信息。因此,要经过下列数据预处理过程。(1)依据经验去除明显的异常点。(2)考虑材料采购风险的性质,剔除与数据挖掘主题无关的属性,确定恰当的材料采购描述属性。(3)依据挖掘的需求对数据进行相应的转换。在材料采购成本的数据挖掘中,主要的采购材料属性是供应商名称、仓库名称、材料名称、材料类别、数量、计划单价、实际单价、计划成本、实际成本、超支(节约)差异等等。表1为某企业部分材料采购成本表,已经过数据预处理。先根据材料采购成本的属性对采购业绩考核的重要性,选择材料的实际成本、超支(节约)差异属性作为分类的依据。然后,为了降低材料采购成本的量度影响。对上述两个属性归一化到0和l之间。公式为:归一化值=属性/属性中最大值。
表l
(四)模型评估。建立挖掘算法的模型是数据挖掘工作的重要环节。可以使用多种方法分别操作数据集,评估各模型的效果,从而寻找出合适的分析模型。在材料采购成本的数据挖掘中,可以运用分类树方法建立分类决策树,也可以采用聚类分析方法,以材料的实际成本和超支(节约)差异为属性将材料成本分为几类。此分类结果,可用于新增材料成本的分类。实现控制的程序化和自动化。
通过SPSS软件的聚类分析工具。使用K均值分类法处理上表的数据。按照设定的分类数目,从随机的初始分区开始,依据样本和类间的相似程度,将样本分配到各类,使之满足相应的收敛准则。过程如下:根据类中心的距离最小原则,把各项目分配到各类中去。产生第1次迭代的K类。根据每类的各项目计算其属性均值,产生第2次迭代的类中心。依次类推,反复迭代,直到达到规定的迭代标准或迭代次数为止。本例K均值分类法选定的类中心数为4,分类属性为归一化材料实际成本和归一化材料超支(节约)差异。经过3次迭代。得到聚类结果,如表2和表3所示。
表2 最终聚类中心
表3 最终聚类结果
(五)解释模型和得出结论。通过对数据挖掘构建的模型进行解释和评价,从大量的、随机的、模糊的、有噪声的实际数据中,提炼出有用的信息和知识,并以用户可理解的语言或可视化的形式呈现给用户。利用数据挖掘获取的信息,分析过去的交易和事项,也为未来的经济业务事项提供决策依据。当出现新交易和事项时,要分析和评价模型的适用性。或适当地修改模型。
从最终聚类中心来看,第1类是超支严重,实际成本较高的材料。该类材料应重点关注。可能是采购成本控制不到位,或者是原来制定的计划成本不合理,大大低于市场价。要深入分析原因,采取对策,若是采购人员的工作过失,耍责其改正,严重的要追究责任,使采购成本控制在合理的范围。第2类是超支较严重,实际成本不定的材料,应给予一定的关注,寻找降低采购成本的方法和途径,尽量做到不超支。第3类是既没超支也没节约,实际采购成本相对较为合理的材料。这类材料采购成本控制压力较小,可以减少关注程度。第4类是实际成本小于计划成本。实际成本不定的材料。这类材料采购成本控制工作做得好,应表彰奖励采购人员。总结推广经验。但要注意防止购买价低质次的材料。经过上述聚类分析。将材料采购成本分为4类,分别采取不同的措施。提高了材料采购成本的控制效率。减少了控制的随意性和采购风险。
上述五个阶段紧密相联,一环扣一环,相互作用,各个阶段都有新的方法和信息注入。
三、结束语
将数据挖掘技术用于采购成本控制分析。是挖掘ERP系统应用潜力、控制采购成本和采购风险、提高采购管理水平的有益探索。而且,数据挖掘还可以扩展到采购管理子系统其他方面以及财务管理、销售管理、生产制造、人力资源管理等ERP子系统中。形成一个基于数据挖掘的功能更强大的ERP系统。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15