京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据商业的未来
最近几年可以看到,从软件开源到数据开放的运动正在兴起。开放主要追求自由、平等、责任和乐趣。但目前在美国有很多关于数据开放的争议,比如什么样的数据应该开放,开放到什么程度,究竟开放原始数据还是开放经过加工和解读过的数据……
可以看出,数据和信息的发展驱动着管理决策的发展,管理层也在不停地演变。
1970年代,赫伯特·西蒙提出,由于人们在决策过程中的理性是有限的,所以需要用计算机支持决策系统,帮助决策者扩大理性范围。此时出现了IBM研究员发明的关系型数据库——这种数据库结构化高、独立性强,之后出现了大型的信息管理系统。随着1980年代数据仓库的出现,数据挖掘开始兴盛,沃尔玛“啤酒+尿布”的故事是人们经常说到的案例。1990年代初,令人震惊的联机分析开始出现,这种分析方法可以从任何一个角度把数据切片化。然后就是商务智能。联机分析是对数据透视性的探测,可以通过“X光”从任何角度对数据做切片分析,数据挖掘就好比挖山凿矿性开采,而商务智能就是对未来的预测。
之后就是数据可视化,用图形表示数据和思想。如果不能把数据图像化,就无法理解它的最深层意思。数据可视化包括数据整合、分析、挖掘,最后到展示。
每一轮经济浪潮都是由几个主题引领的。在美国,一度是一系列诸如IBM、微软这样的IT公司,到后来的诸如Google等一系列的互联网公司,然后就是类似Facebook这样的社交网络,这些主题引领着美国经济的发展,大数据有望引领自从IT与互联网泡沫以来的下一轮经济增长浪潮。中国将成为全球最重要的大数据市场,很多中国的着名互联网公司已经开始在大数据上布局。
趋势与特征
大数据时代的产业发展有三个趋势:应用软件将泛互联网化、行业将垂直整合、数据将成为资产。
泛互联网化是收集数据的重要渠道,没有泛互联网化的软件,公司就难以获得用户的行为数据。随着行业的垂直整合,企业通过搜集大量的用户数据,可以更贴近用户,更理解用户,为用户提供更适用的服务。谁离客户越近,谁就在产业链上的话语权就越高,谁的数据价值就越高。数据将成为一种资产,将有可能取代石油成为全球最大的交易商品。
海量、增值、全息可见、融合复用是新媒体时代大数据的四大特征。并不是所有的数据都同样有价值,只有能带来编增值数据才是有意义的。大数据的融合和可流转性将是大数据时代真正发挥数据价值最核心的要求。如果数据不能够在企业和社会之间流动,那数据将变成一个个的信息孤岛而封闭存在,无法发挥最大的价值。所以,数据的交叉复用以及可流转性是大数据发挥巨大商业价值的前提。
新媒体时代,数据总量正在发生巨大变化。现实中,信息量在增加,但消费者个体却面临着信息过窄的问题,消费者的分析处理、筛选、过滤信息的能力并没有得到提高。另一方面,数据形态也在变化,从结构化向半结构化、非结构化方向发展,也从单渠道开始向多渠道方向发展。跨屏所产生的数据结合了互联网和移动互联网的数据,都在催生着移动互联网的发展。
方向与新商业模式
个性化是大数据精细化和融聚力的一个发展方向。
用户的信息饥渴感在与日俱增,希望利用碎片化的时间获得有价值的信息。但同时,用户对非关联信息的容忍度却在与日俱减,用户变得越来越不耐烦,如果推给他不相关的广告信息是他不想要的,用户体验会迅速下降。而在用户兴趣数据与日俱增的同时,用户甄别信息能力占比却在与日俱减。
从2B到2C到2D是面向数据的新商业模式。在美国,诸如Google、微软、亚马逊、苹果这样的公司已经建立了一个大数据平台。大数据平台建立起来后,一定是希望这些数据能够有效地在数据需求方之间进行流转。比如,可以供诸如北大、清华,南开等科研机构获取到能够用来做深度研究的原始数据。
而个人用户和个人终极应用开发者也需要平台上的数据流转。美国政府把机场飞机晚点的数据开放出来后,有的开发者就开发了一个应用,直接接到大数据平台把数据调出来,可以帮助每一个想坐飞机的人在下雨、下雪、天气好或不好的时候,不同航空公司在这个机场的晚点率是多少。比如,三角洲航空公司在下雨天的晚点率是78%,美联航的是率65%,方便旅客预估到达的时间。
未来挑战
大数据和新媒体都面临着未来的挑战。
挑战之一就是构建完整的消费者兴趣图谱,基于这个可以精准发现不同的用户有着不同的兴趣。
打通互联网和移动互联网的数据是另一个挑战。几个月以前在美国有一家公司,它仅仅是通过一种基于互联网和移动互联网的算法,就能够有效预测用户在移动互联网上的行为。这家公司靠这个理论和实践获得了600万美元的A轮融资。
从电子商务到社交媒体,再到移动互联网,我们看到了大量个性化的技术和商业应用的兴起。如今,企业的CMO们都关注怎样才能更有效、更精准地找到自己的目标客户群。也许你知道你的广告投入要有50%,但却不知道是哪50%。新媒体时代的大数据环境下,能够非常精准地定位每一个广告投入点,能够基于用户行为进行预测。如果能够把广告变成有用的信息,那么用户就不再不喜欢广告了。
最后一个挑战就是用户隐私法律的完善。如何定义用户隐私,也是最近很多企业和媒体正在关注的问题。如果说用户隐私是根据一些信息,根据某个数据能够帮助用户准确地标识出现实世界中唯一的某一个个体,比如他的姓名、电话、身份证号,这些属于信息隐私。如果根据这些数据无法标识出来具体人,其实这并不构成用户隐私。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21