京公网安备 11010802034615号
经营许可证编号:京B2-20210330
不养数据的企业将死在大数据的路上
养孩子大家不陌生,养数据比养孩子可麻烦多了:费心、费力、费钱。养孩子只是自己家里面的事情,而养数据不仅仅是一个公司的行为,有时候还需要去养异业合作的客户的数据,甚至去养生态圈的数据。
孩子不养不成材,数据不养也长不大,后果是数据缺失,垃圾数据满天飞。
我们熟悉数据分析,但是养数据这三个字儿对很多人来说是陌生的。百度了一下:“养数据”只有58.5
万条网页(一个月前只有25.6万),而“数据分析”却有5470万条网页,侧面说明了养数据的重视度远远不够的。
“养数据”甚至没有百度百科的解释,百度指数中也没有收纳这个词,并且百度养数据出现的是让我哭笑不得的如下内容。
养猪、养鱼....什么鬼!
离开了数据谈决策是耍流氓,不主动养数据谈什么数据?数据不会自己从天而降,有些数据即便你有钱也买不到。养数据就如养孩子一样,真的是一把屎一把尿的拉扯大的。不多说了,没有孩子的人是没办法体验养数据之苦的。
数据分析这几年被空前的重视,我自己感觉也是这样,这两年找我做数据化管理的培训和咨询的企业尤其多。这些企业一上来就是数据分析技巧,数据分析理论,数据化决策等等。而看他们提供给我数据则是不忍目睹,各种数据缺失,各种不规范,数据源质量一塌糊涂。如顾客名字叫坑爹,会员年龄100多岁,手机号135790248*......
养数据必须被企业的管理层和业务单位重视起来,扯皮不是理由,懒惰不是借口。作为数据单位有义不容辞的责任去控制数据质量和内容。只有数据质量和数量提升了,企业才可以谈什么数据驱动,DT时代。否则,请住嘴。
养数据的典范:雅昌的故事
雅昌是一个深圳的企业,93年成立的时候只是一个搞印刷的小作坊,而现在它被大众熟悉是因为我们的奥运会、世博会等的宣传材料是他们印刷的,而且雅昌艺术品拍卖网是国内最权威的艺术品拍卖门户网站。
它有9万多位艺术家的电子资料,1200万艺术品展览和拍卖的数据,3500多万件艺术品资料。雅昌就是一个艺术品的大数据库,世界上所有的拍卖行都必须要和它合作,因为有些艺术品只有它才有电子版的资料。
一切的一切只有一个关键词:养数据!
雅昌的老板很有养数据的意识,当年还是一个小作坊的时候,他就要求员工必须要把客户的印刷资料作为电子版本保存起来。大家可以想一想,那可是90年代,还是磁盘存储的年代,存储还是以MB为单位而不是现在流行的G。
所有客户的电子数据就这样被保存起来了,直到后来数字存储技术的发展,他们才把所有收集的数据分门别类的归档。于是,别人没有的电子资料雅昌有,老一代艺术家作品只有雅昌有电子版......
随着雅昌自己印刷业务的增长,它收集的数据也越来越多,数据就是这样被养大了。再后来雅昌顺理成章的“跨界”艺术品门户。
养数据是苦逼的工作,有时候甚至短期看不到未来,但是坚信必有收获。大的方面来说养数据包含三方面:
完善数据结构,把数据养大
1、企业数据库中有的字段必须要全部收集起来,尽可能的不要留白。
2、有用但是现在没有的数据必须想办法收集起来,例如传统零售的客流数据,客流动线数据。
3、暂时用不到的数据,本着先收集再应用的原则。对于一个零售门店来说最有用的数据可能不是顾客的购买数据,反而是顾客“不”购买的数据,清楚了顾客为什么不购买对于企业的商品规划,营运流程再造是有巨大好处的。就如飞机修理厂为了解飞机哪个部分最容易被击中,派人统计飞机出故障的部位。发现主要问题在机翼的部分,那里弹孔最多,于是他们决定把机翼部分加强。其实在战场中被击落没有飞回来的飞机数据才是最有意义的。
4、跨界合作得大数据。线上企业要了解线下就必须要和传统零售合作,打通各种数据孤岛。
提高数据质量,把数据做精
有数据但没质量是企业数据的通病,原因不外乎基层数据录入太随意,定义不清楚,网络硬件等影响原因。比如有些服装专卖店的员工平时很忙没时间将订单录入系统(百货店铺品牌方的系统和商场收银是分离的),于是店长就每天下班前才将所有的当日订单合并到一起录入进销存系统。这样的危害是巨大的。
1、进销存系统变成了单纯的财务对账系统,说好的数据分析根本无从下手;
2、没办法分析顾客的客单价和连带率(平均顾客购买数量),因为n张订单被人为的合并了;
3、没办法分析店铺按时段的成交规律,所有订单都只是显示一个时间点。
提高数据质量这种事情只能是企业从营运端入手严防死守,前提是重视!不难!
要有数据入库的意识
数据库数据库就是尽可能的让数据在数据库中,而不是在excel中。企业很多数据其实是在excel中的,比如促销活动的开始时间、结束时间、活动内容等。还比如店铺在商场的位置,楼层,店铺级别等信息也是在excel中而不是在系统中的。
别让一些基础数据躺在excel中,一定要想办法放到数据库中去。一是安全,而是更利于数据的场景化,否则就只是一些干巴巴的数字。
养数据是一个长期艰巨的工作,并且得不到企业管理层重视,也得不到基层员工的积极配合。但是必须要克服困难,上!
两个建议:
1、养数据必须基于5年后的数据需求来规划布局;
2、养数据必须结合业务场景来思考。
一个企业在养数据的层面上谋划越深越前瞻性,才可能在数据驱动营运,驱动决策的路上越走越顺
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在金融行业的数字化转型进程中,SQL作为数据处理与分析的核心工具,贯穿于零售银行、证券交易、保险理赔、支付结算等全业务链条 ...
2025-12-24在数据分析领域,假设检验是验证“数据差异是否显著”的核心工具,而独立样本t检验与卡方检验则是其中最常用的两种方法。很多初 ...
2025-12-24在企业数字化转型的深水区,数据已成为核心生产要素,而“让数据可用、好用”则是挖掘数据价值的前提。对CDA(Certified Data An ...
2025-12-24数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-12-23CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-23在Power BI数据可视化分析中,矩阵是多维度数据汇总的核心工具,而“动态计算平均值”则是矩阵分析的高频需求——无论是按类别计 ...
2025-12-23在SQL数据分析场景中,“日期转期间”是高频核心需求——无论是按日、周、月、季度还是年度统计数据,都需要将原始的日期/时间字 ...
2025-12-23在数据驱动决策的浪潮中,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越“整理数据、输出报表”的基础层面,转 ...
2025-12-23在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17