
不养数据的企业将死在大数据的路上
养孩子大家不陌生,养数据比养孩子可麻烦多了:费心、费力、费钱。养孩子只是自己家里面的事情,而养数据不仅仅是一个公司的行为,有时候还需要去养异业合作的客户的数据,甚至去养生态圈的数据。
孩子不养不成材,数据不养也长不大,后果是数据缺失,垃圾数据满天飞。
我们熟悉数据分析,但是养数据这三个字儿对很多人来说是陌生的。百度了一下:“养数据”只有58.5
万条网页(一个月前只有25.6万),而“数据分析”却有5470万条网页,侧面说明了养数据的重视度远远不够的。
“养数据”甚至没有百度百科的解释,百度指数中也没有收纳这个词,并且百度养数据出现的是让我哭笑不得的如下内容。
养猪、养鱼....什么鬼!
离开了数据谈决策是耍流氓,不主动养数据谈什么数据?数据不会自己从天而降,有些数据即便你有钱也买不到。养数据就如养孩子一样,真的是一把屎一把尿的拉扯大的。不多说了,没有孩子的人是没办法体验养数据之苦的。
数据分析这几年被空前的重视,我自己感觉也是这样,这两年找我做数据化管理的培训和咨询的企业尤其多。这些企业一上来就是数据分析技巧,数据分析理论,数据化决策等等。而看他们提供给我数据则是不忍目睹,各种数据缺失,各种不规范,数据源质量一塌糊涂。如顾客名字叫坑爹,会员年龄100多岁,手机号135790248*......
养数据必须被企业的管理层和业务单位重视起来,扯皮不是理由,懒惰不是借口。作为数据单位有义不容辞的责任去控制数据质量和内容。只有数据质量和数量提升了,企业才可以谈什么数据驱动,DT时代。否则,请住嘴。
养数据的典范:雅昌的故事
雅昌是一个深圳的企业,93年成立的时候只是一个搞印刷的小作坊,而现在它被大众熟悉是因为我们的奥运会、世博会等的宣传材料是他们印刷的,而且雅昌艺术品拍卖网是国内最权威的艺术品拍卖门户网站。
它有9万多位艺术家的电子资料,1200万艺术品展览和拍卖的数据,3500多万件艺术品资料。雅昌就是一个艺术品的大数据库,世界上所有的拍卖行都必须要和它合作,因为有些艺术品只有它才有电子版的资料。
一切的一切只有一个关键词:养数据!
雅昌的老板很有养数据的意识,当年还是一个小作坊的时候,他就要求员工必须要把客户的印刷资料作为电子版本保存起来。大家可以想一想,那可是90年代,还是磁盘存储的年代,存储还是以MB为单位而不是现在流行的G。
所有客户的电子数据就这样被保存起来了,直到后来数字存储技术的发展,他们才把所有收集的数据分门别类的归档。于是,别人没有的电子资料雅昌有,老一代艺术家作品只有雅昌有电子版......
随着雅昌自己印刷业务的增长,它收集的数据也越来越多,数据就是这样被养大了。再后来雅昌顺理成章的“跨界”艺术品门户。
养数据是苦逼的工作,有时候甚至短期看不到未来,但是坚信必有收获。大的方面来说养数据包含三方面:
完善数据结构,把数据养大
1、企业数据库中有的字段必须要全部收集起来,尽可能的不要留白。
2、有用但是现在没有的数据必须想办法收集起来,例如传统零售的客流数据,客流动线数据。
3、暂时用不到的数据,本着先收集再应用的原则。对于一个零售门店来说最有用的数据可能不是顾客的购买数据,反而是顾客“不”购买的数据,清楚了顾客为什么不购买对于企业的商品规划,营运流程再造是有巨大好处的。就如飞机修理厂为了解飞机哪个部分最容易被击中,派人统计飞机出故障的部位。发现主要问题在机翼的部分,那里弹孔最多,于是他们决定把机翼部分加强。其实在战场中被击落没有飞回来的飞机数据才是最有意义的。
4、跨界合作得大数据。线上企业要了解线下就必须要和传统零售合作,打通各种数据孤岛。
提高数据质量,把数据做精
有数据但没质量是企业数据的通病,原因不外乎基层数据录入太随意,定义不清楚,网络硬件等影响原因。比如有些服装专卖店的员工平时很忙没时间将订单录入系统(百货店铺品牌方的系统和商场收银是分离的),于是店长就每天下班前才将所有的当日订单合并到一起录入进销存系统。这样的危害是巨大的。
1、进销存系统变成了单纯的财务对账系统,说好的数据分析根本无从下手;
2、没办法分析顾客的客单价和连带率(平均顾客购买数量),因为n张订单被人为的合并了;
3、没办法分析店铺按时段的成交规律,所有订单都只是显示一个时间点。
提高数据质量这种事情只能是企业从营运端入手严防死守,前提是重视!不难!
要有数据入库的意识
数据库数据库就是尽可能的让数据在数据库中,而不是在excel中。企业很多数据其实是在excel中的,比如促销活动的开始时间、结束时间、活动内容等。还比如店铺在商场的位置,楼层,店铺级别等信息也是在excel中而不是在系统中的。
别让一些基础数据躺在excel中,一定要想办法放到数据库中去。一是安全,而是更利于数据的场景化,否则就只是一些干巴巴的数字。
养数据是一个长期艰巨的工作,并且得不到企业管理层重视,也得不到基层员工的积极配合。但是必须要克服困难,上!
两个建议:
1、养数据必须基于5年后的数据需求来规划布局;
2、养数据必须结合业务场景来思考。
一个企业在养数据的层面上谋划越深越前瞻性,才可能在数据驱动营运,驱动决策的路上越走越顺
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-07抖音数据分析师:驱动平台增长的幕后推手 在抖音这个日活用户数以亿计的超级平台上,每一次用户的滑动、点赞、评论,每一条 ...
2025-08-07基于 SPSS 的中介效应分析结果解读:揭示变量间的隐性关联 在社会科学与自然科学研究中,变量之间的关系往往并非简单的直接作用 ...
2025-08-07