京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的四个价值:记录、备份和监督
大数据是当今热门的话题,对于大数据很多人提出过这样那样的观点,那么大数据到底是什么,能够给我们带来怎样的价值呢?瑞意趋势CEO 梁海宏来和大家做一下解读。数量巨大,情境微观结合的运行记录信息最终的结果就是大数据。
尽管运行记录信息不是大数据的全部,但却应该是以后大数据的主流。目前我们看到的金融、电信、航空、电商、零售渠道等领域中的大数据,多数也都是运行记录信息。
大数据具有采集过程价值未知、力争全面、即时、系统性并发的记录方式,以及主受体统一和大微观的特征,这些特征决定了大数据的价值发挥。
数据本身被记录下来,并非全部是为了长远的利益所用。很多记录其实发挥的作用是一种操作的基础,脱离了记录,后续的操作将难以进行。这点与人脑的作用有点相似。我们每个人在做一个即时操作的同时,大脑都会加以记录。然后依据这些记录快速决定下一步怎么做,即时的这些记录仅仅是一种情景辅助的作用。
数据记录也是对以前操作过程的一个虚拟备份,记录了各自多方不同的操作过程及次序,乃至不同环节的具体操作内容。这样一种作用可以看作是记录本身最被认可的初始价值。历史上的各种备忘录,金融记录(例如会计),甚至包括历史都是出于这样一种动机来加以记录的。记录让操作的当时情景有了复原的可能性,哪怕只是一种并非完整的复原。
这种复原除了纪念意义等的考虑外,还有一个重要的价值就是事后的责任追究,是一种奖惩的基础。这样一种作用看似很微小,但却是人类社会运作的基础。尤其是在连接时代的今天,不同主体之间的交互不断加剧,情景复原会让每个主体对自己的操作更为负责,让各种有效的连接成为一种可能。
随着互联网与线下实际经济行为的日益融合,一次鼠标点击有可能代表着很大的利益转移,结合网络协议的操作记录成为了大家网上操作时承担对应责任的依据。
延伸案例:
淘宝网鼓励买家与卖家在旺旺上聊天的时候将聊天记录保存下来。在具体的投诉环节,相互之间的聊天记录可以作为一种证据去为自己辩护。而包括中间买方下单,支付款项,卖家发货,快递公司名称以及单号,甚至包括该单在快递过程中的状态,时间,甚至有些快递公司将具体快递员的姓名和电话也记录在内,最后签收的方式等都被详细的记录下来。所有这些记录发挥了一种情景复原以及事后追究责任的作用,从而确保了交易的正常进行。
旺旺记录
一个系统在运行的过程中,有些时候也会出现一些跟平常不一样的差异所在。当这种差异所代表的数据通过极值等各种方式体现出来的时候,系统本身的原有平衡可能会被打破,内部各方面的环节或资源就有可能跟不上。这个时候适当的外力参与很有必要,以免出现系统崩溃的情况。
打破平衡
例如汽车上的自动定速巡航可以根据驾驶者设定的速度,汽车调配油门的大小进行不断的微调。当汽车速度超过预设速度多少的时候,就开始减小油门,当速度低于多少的时候,就开始加大油门。通过将当前的速度记录与标准设定的速度进行对比,通过一种模糊控制的方式来进行调整,从而发挥情景指引的作用。
一个企业的产供销系统,一个城市的交通系统,甚至一个国家的人口政策,资源利用等都可以通过这样一种方式来进行微调,从而确保系统的良性运行。
背景案例:中国的计划生育政策
中国的计划生育政策已经执行了很多年,而且也取得了一定的效果。但最近几年随着中国人口老龄化的加快,未来一些年社会对劳动力的需求会逐渐加强,劳动力短缺有可能成为中国的关键问题。
在这样一种情况下,基于各种人口数据的不断变化,适当地进行人口政策的调整已经变成一种必须。但具体怎样调整,则需要根据数据来说话。
对未来的预测功能是目前业界对大数据最看重的价值之一。基于之前记录下来的各种数据的深入研究,发现其中的规律特征,从而进行系统优化,甚至升级。如果前面的纠偏只是一些相对较小的指引的话,那么基于预测的情景研究和系统优化,则是相对较大的变动。这种基于预测的价值实现对系统(包括个人、企业机构,也包括各种电子性工具)的长远运行来说价值重大,其决定了一个系统是否具有长期的成长性和演变能力。
一个主体(系统)不但要考虑即时的运行,以及下一步的正确操作,更需要考虑长远的运行可能。尤其是在竞争激烈的今天,各种企业机构之间的竞争非常残酷。如何基于以往的运行数据,对未来的运行模式进行预测,从而提前进行准备或者加以利用、调整,对很多企业机构其实是一种生死存亡的问题。这样一种情况同样适用于国家级别。正因为这一点,目前无论是在企业级别还是国家级别都开始研究、部署大数据。
延伸阅读:玛雅预言与人类地球的毁灭
著名的玛雅预言,尽管背后有着一定的天文知识基础,但在2011年除催生了一部很火的电影《2012》外,其实很多人的生活没有受到太大的影响。但现在基于人类地球上的各种能源存量,以及大气受污染、冰川融化的程度,我们确实可以推算出按照目前这种工业生产、生活的方式,人类在地球上可以存活的年数。《第三次工业革命》中对这方面有很深入的解释。基于精准预测,发现现有模式是死路一条后,人类就可以进行一些改变,这其实就是一种系统优化。
这种结合之前情景研究,不断进行系统优化的过程,将赋予系统生命力。而大数据就是其中的血液和神经系统。通过对大数据的深入挖掘,我们将会了解系统的不同机体是如何相互协调运作的,同样也可以通过对他们的了解去控制机体的下一个操作,甚至长远的维护和优化。
从这个角度讲,基于网络的大数据可以看作是人类社会的神经中枢,因为有了网络和大数据人类社会才开始灵活起来,而不像以前那么死板。基于大数据,个体之间相互连接有了基础,相互的交互过程得到了简化,各种交易的成本减少很多。厂家等服务提供方可以基于大数据研发出更符合消费者需求的服务,机构内部的管理也更为细致,有了血液和神经系统的社会才真的有了生命。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-12-23CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-23在Power BI数据可视化分析中,矩阵是多维度数据汇总的核心工具,而“动态计算平均值”则是矩阵分析的高频需求——无论是按类别计 ...
2025-12-23在SQL数据分析场景中,“日期转期间”是高频核心需求——无论是按日、周、月、季度还是年度统计数据,都需要将原始的日期/时间字 ...
2025-12-23在数据驱动决策的浪潮中,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越“整理数据、输出报表”的基础层面,转 ...
2025-12-23在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15