京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们需要更多数据还是精确数据
不断过滤清理数据,直到确保它的正确性的日子已经逐渐成为奢望,尤其是当IT部门需要以更快的速度和更多的灵活性来响应业务部门的需求时。但是,提供实时数据的使用也让CIO们产生了一个基本问题:数据究竟如何才算正确呢?
Farzad Mostashari,美国卫生和公众服务部的,前卫生信息技术的国家协调员,就曾经论证了解决错误数据的方法就是更多的错误数据。在去年夏天举行的一个信息质量会议上,他曾经说过,不断增加的数据“为你提供了上下文,”.其他专家,比如Michael Berry,Trip Advisor网站的业务运营分析总监,则认为并非如此。他在去年秋天的预测分析大会上说,他认为并不需要担心数据的正确性,因为他们有太多的数据“肯定就是错误的,”.
Greg Pfluger,American Family Insurance公司的信息系统副总裁,则有不同的观点。在本期专家访谈中,Pfluger在麦迪逊,威斯康星州举行的Fusion 201 4CEO-CIOSymposium研讨会上,向CIO们和IT主管们就此进行演讲,并回答相关问题:更多的数据还是正确的数据?
GregPfluger:这有可能是未来五年内,IT界将不得不面对的关键问题之一。我们拥有大量的不断涌现的外部数据来源,因为各种业务需求我们需要整合这些数据–但有时我们并不清楚这些数据仅是作为数据的一部分,还是这些数据要求高度正确性。我并不认为通过这次的讨论,我们可以从行业标准,得出两个或三个类别的硬性指标,并都以此作为参考。随着时间的推移,这些类别在不同的业务部门和行业都会不同。我鼓励IT主管们,自己思考在他们所处的特定分析环境下,应该如何对这些数据进行分类。
例如,CIO可以把数据分成三个类别:类别一,我们并不在意数据的正确性;我们只是试图让我们的市场营销工作做的更好。如果我们的营销数据从2%上升到3%,我们就是成功的。虽然我们处理的有些数据有些可疑,但是这不要紧。
相比营销数据,第二个类别,用来针对现有客户的数据,质量则要更高一些。我敢肯定,我们都会时不时地因为我们的有线电视运营商的服务和定价而感到恼怒。我每个月至少有一次都会因为我的供应商而恼火,因为不知出于什么原因,他们的老客户数据库和当前的客户数据库并不匹配。当我从StevensPoint,威斯康星州搬走时,我取消了我的服务,我现在住在麦迪逊,从同一个供应商订购了新的服务。但现在,他们不断地尝试想让我重新成为他们的客户-即使我现在已经是他们的客户。他们向我作为账单地址的电子邮件账户发送营销邮件。如此看来,我不能退订这些邮件,因为这样我就会收不到我的账单。他们在一定程度上肯定进行了数据整合,但是肯定没有完全整合正确,因为他们不把我认为是他们的现有客户。
第三个类别,当你试图处理用户事务时,你需要非常高质量的数据。我最近听到了一个同事的经历,由于冬季风暴造成了他的航班延误。在这期间,Delta航空不断向他发送最新的信息,并且自动为他重新预订了航班,因此在这之后,他成为了Delta的忠实客户。现在,他甚至愿意为乘坐Delta的航班而支付额外的费用–哪怕航班取消!
新一代的航空公司服务,我敢肯定,将会更加积极主动。他们会知道一场风暴即将到来,然后向乘客提供提前一天的航班,而不加收费用,这样既帮助你到达目的地,也有助于减少他们系统中的混乱。你可能会很高兴收到这样的电子邮件,为你提供较早的航班离开,也许你甚至愿意为此而多花些费用。但如果风暴的数据错误,或你的地址是错误的,或你的起飞机场是错误的,当你收到这个电子邮件时会发生什么?你会说,‘不对,没有风暴的预报呀,’这一航空公司就会失去信誉–这一切需要很高的精确度。
IT部门需要思考适合他们自己企业的分类类别,并对每个类别提供适当的数据治理方案和数据质量处理流程。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03