京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们需要更多数据还是精确数据
不断过滤清理数据,直到确保它的正确性的日子已经逐渐成为奢望,尤其是当IT部门需要以更快的速度和更多的灵活性来响应业务部门的需求时。但是,提供实时数据的使用也让CIO们产生了一个基本问题:数据究竟如何才算正确呢?
Farzad Mostashari,美国卫生和公众服务部的,前卫生信息技术的国家协调员,就曾经论证了解决错误数据的方法就是更多的错误数据。在去年夏天举行的一个信息质量会议上,他曾经说过,不断增加的数据“为你提供了上下文,”.其他专家,比如Michael Berry,Trip Advisor网站的业务运营分析总监,则认为并非如此。他在去年秋天的预测分析大会上说,他认为并不需要担心数据的正确性,因为他们有太多的数据“肯定就是错误的,”.
Greg Pfluger,American Family Insurance公司的信息系统副总裁,则有不同的观点。在本期专家访谈中,Pfluger在麦迪逊,威斯康星州举行的Fusion 201 4CEO-CIOSymposium研讨会上,向CIO们和IT主管们就此进行演讲,并回答相关问题:更多的数据还是正确的数据?
GregPfluger:这有可能是未来五年内,IT界将不得不面对的关键问题之一。我们拥有大量的不断涌现的外部数据来源,因为各种业务需求我们需要整合这些数据–但有时我们并不清楚这些数据仅是作为数据的一部分,还是这些数据要求高度正确性。我并不认为通过这次的讨论,我们可以从行业标准,得出两个或三个类别的硬性指标,并都以此作为参考。随着时间的推移,这些类别在不同的业务部门和行业都会不同。我鼓励IT主管们,自己思考在他们所处的特定分析环境下,应该如何对这些数据进行分类。
例如,CIO可以把数据分成三个类别:类别一,我们并不在意数据的正确性;我们只是试图让我们的市场营销工作做的更好。如果我们的营销数据从2%上升到3%,我们就是成功的。虽然我们处理的有些数据有些可疑,但是这不要紧。
相比营销数据,第二个类别,用来针对现有客户的数据,质量则要更高一些。我敢肯定,我们都会时不时地因为我们的有线电视运营商的服务和定价而感到恼怒。我每个月至少有一次都会因为我的供应商而恼火,因为不知出于什么原因,他们的老客户数据库和当前的客户数据库并不匹配。当我从StevensPoint,威斯康星州搬走时,我取消了我的服务,我现在住在麦迪逊,从同一个供应商订购了新的服务。但现在,他们不断地尝试想让我重新成为他们的客户-即使我现在已经是他们的客户。他们向我作为账单地址的电子邮件账户发送营销邮件。如此看来,我不能退订这些邮件,因为这样我就会收不到我的账单。他们在一定程度上肯定进行了数据整合,但是肯定没有完全整合正确,因为他们不把我认为是他们的现有客户。
第三个类别,当你试图处理用户事务时,你需要非常高质量的数据。我最近听到了一个同事的经历,由于冬季风暴造成了他的航班延误。在这期间,Delta航空不断向他发送最新的信息,并且自动为他重新预订了航班,因此在这之后,他成为了Delta的忠实客户。现在,他甚至愿意为乘坐Delta的航班而支付额外的费用–哪怕航班取消!
新一代的航空公司服务,我敢肯定,将会更加积极主动。他们会知道一场风暴即将到来,然后向乘客提供提前一天的航班,而不加收费用,这样既帮助你到达目的地,也有助于减少他们系统中的混乱。你可能会很高兴收到这样的电子邮件,为你提供较早的航班离开,也许你甚至愿意为此而多花些费用。但如果风暴的数据错误,或你的地址是错误的,或你的起飞机场是错误的,当你收到这个电子邮件时会发生什么?你会说,‘不对,没有风暴的预报呀,’这一航空公司就会失去信誉–这一切需要很高的精确度。
IT部门需要思考适合他们自己企业的分类类别,并对每个类别提供适当的数据治理方案和数据质量处理流程。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16