京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的商业价值实现关键在于连结
我的英文主题的大数据的商业价值实现关系在于连结,但是在这个之前,我想跟大家分享一下前面阿里几位演讲嘉宾的评论我很受启发。
第一个大数据是相通的,数据本身并不本身任何的意义,只有在当他和一个他所表示的一个事情连结上以后,才能知道这个意义在哪里,或者价值在哪里。比如说有一种大数据对你来说就是一个大市场的表现,有一种大数据就是一个很大的人群,他们在你的平台上的行为,只有这么想了以后这个大数据才他对您真正的价值和意义有链接。
第二个我很受启发的,大数据在很多年前已经提出,那么他对你的意义如何?其实每个工业的形成,都有这样一条发展的路程,第一是由少数的人他们比较有远见,看到了一个很小的一个数据的能够被储存,能够被用来表达一个很复杂的现象,或者一个事物,从这个里面发挥了以后就逐渐进入一个新的商业应用的领域,这是当年的数据库计算机的发明和应用都是走了这样的路子,所以第一个是少数人的远见促进了这样一个形成。第二个进入科学阶段,有了科学之后这个事情就能不断的重复,而且可以有方法来证明,如果你是照着某一种进程来开展活动的话,你的结果是可以被预测。第三个部分就是进入工程的应用。我也很欣赏品觉一句话,真正的价值在于更多的人使用,只有一两个人能懂能使用这个价值不会很大。第四个部分跟我今天的主题有关,大数据的来源,为什么在今天不在一百年之前,或者在于电脑刚刚发展的时候,或者在于数据库,在几十年形成的时候,为什么这些数据不大呢,为什么今天的大就变得这么重要呢?主要的原因是一个网络。这个网络的形成,不是有了电脑就形成网络了,而且网络广泛的使用也是有很多的阶段。第一初级的网络是在企业内部的,电脑的使用的这个网络。第二部是英特网,把很多的公司很多子网络联在一起。
第三个是在网络上软件的开发,使得很多本来根本没有在网络硬件的基础上获取信息、交流信息以及传播信息今天都成为可能。所以,这一些网络的这个建设和网络的普遍应用成熟,使得大数据的产生有了今天的这样一个可能。
回到演讲。我今天要讲的主题是什么呢?再回到这个网络,大数据形成的本身,并不能保证他的大量的价值的实现,那么要实现这个价值,又得回到这个网络。举个比喻,中国现在汽车的发展这么迅速,很大的一个原因是在道路的开拓,有了很多的道路,这个汽车有地方可以车。但是如果道路的形成,道路的管理跟不上汽车的销售以及使用的话,就出现了大量的道路拥挤,汽车的价值无法实现。那么数据同样的道理,在网络当中形成的数据,如果被很多种原因变成一个一个单独的平台,单独的一个应用的这样一个环境的话,他的价值也远远无法实现。所以必须通过网络的想法来想这个大数据的价值以及他的运用。
大数据是一种洪水的现象,数据实际上已经远远超过我们从里面得到的洞察,以后根据洞察我们所采取的行动这种能力。就像以前感觉到吃饭吃不够,还想吃,但是今天这个是吃不了。这种现象是很多的程度上都存在于我们生活的体验中,那么现在到了数据,这是一种更极端的体验。大家可以看到,文明的开始我们创造了这么多字节,我们以前在国内在图书馆的时候我基本上都能看过,现在图书馆的书基本没有办法看全,所以这个现象已经到了极端。大数据还在不断的增长,这里面其中还牵涉到数据和数字不是完全等同的,数据可以在电脑里面用数字来表达,但是他表达的这些数据的形式往往现在更多的是跟人的交换信息是比较一致的,比如说用文字、图象、音乐。昨天我跟玫瑰爵士,玫瑰讲到一个美,很多人看到玫瑰都认为是美的,但是用数据怎么表达?如果对美能够用数据表达出来,对音乐的欣赏能够用数据表达出来,让美不断达到一种极限也是成为一种可能。所以这里面就形成了很多数据已经成为半结构或者无结构的,但是这些结构远远不足以表达我们的大自然、市场、想象力的丰富。
第三个大数据成倍的增长,这种增长我们感到必须提高到我们每一个大企业管理层必须得到高度的重视,这个里面很可能有一种企业有一种管理的方式,有一种工程的软件的实现,会使得这个数据的资源的利用,远远超过我们现在产生大数据的这些大平台已经大公司。所以阿里我感到确实有远见,把这个提高到这样一个高度。
大数据形成了很多悖论,所谓的大,我们看到的数据之大,但是价值之小。这就像你有一只船在大海里开,你看到很多水,但是一滴水都不能喝。现在大数据的情形就很类似,所以我们要能很快的能够解决这个瓶颈口的问题。
这个大数据的提出呢,已经使得很多方面的专业人士、管理人士感到应用的可能,大家都在探索。其中一个探索很大的领域就是营销。营销以前都是我们说的广播的方式,媒体的传播是很广的,当然媒体的使用只有少数人能够使用,大家都在想怎么能够把我媒体的宣传,以及营销的个性化。但是这个个性化了以后你就做不到大,你覆盖的范围就小了,成本就提高了。但是现在有了数据有了媒体的技术的提高,使得在大规模的前提下,覆盖面可以达到整个市场,但是还能保证你的个性化的发挥。所以呢,我们今天有很多媒体的朋友在,我引进了一个新词,这是用一个大数据的形式用技术的手段来实现一个窄播,而不是广播。那么窄播现在用技术的力量可以比广播更有效,而且达到的覆盖面以及有效的回报更广。
我做了一些想象,以前我们的数据不大,我们是怎么生活的呢?我们是怎么会有这样一个阿里这么一个强劲的公司呢,我们为什么会国家经济发展了,现在在数据这么大了以后,这个情况是不是会更好呢?我就想这样一些问题。
以前数据是小,所以由于数据小信号是不全,但是信号的使用信号的被发现,信号的价值还是比较充分的,这是相对来说。有了大数据以后,信号是成倍成倍的增大了,但是毫无疑问,信号的增大并不代表信号本身的发现是容易的,因为这个噪声的增加,没用信息的增加,远远超过信息的增加。这里也给大家看一下,在营销的这个领域里面,跟消费者互动的这个方面,大数据的一些起到的作用,以及他们对数据管理、数据的速度的反应这方面的一些要求。
在很多年以前,安客诚公司已经开始,先在美国然后在全球,开拓了很多的数据。这些数据就是单从数据方面来说,已经是达到相当大的规模,在美国我们管理一个消费者的数据库,有2.4亿个成人在这个数据库里面,总共人口是差不多4亿,2.4亿成人就是18岁以上都在我们数据库里面。这2.4亿相当于是1.4亿个家庭,这1.4亿个家庭每个家庭的单位上我们有1700条信息,再加上4000个购买倾向性模型打分。那么这些东西呢,在储存、使用方面,当然是有很大的挑战,但这已经有很多的技术被有效的使用来管理这么大的信息。这是我讲到的字节的数量,以及他们时间上的要求,今天的数据传播和使用的一些时间上的反应速度。
第二个阶段呢,就是到了把他数据再专门化,用到每个应用上去,这时候反应速度的要求是在几分钟以内,字节相对来说比较小一些,因为他更窄了,针对某一个专业的应用,使得它能够适合他的要求,比如说对某一个客户的要求,某一个在媒体方面的使用,数据量不大,但是对时间反应速度的要求就提高了。再往上继续保持这个趋势,数据量减少,应用专门性提高,那么对他反应的要求也进一步提高,在秒钟这个级别。在往上消费者就是要跟大批的消费者,在媒体上互动,他在网页上点击一下,你下一个网页不是同一个网页,而是根据消费者行为的了解和个人的了解,下一个网页是最有效最具有个性化的,那么他的反应速度达到微秒级,那么这个网页往往不是在PC上,而是在手机上的,包括现在更进一步的是孩子们,他们对数据反应的要求是更高,所以达到微秒级。
那么这些大数据的数量和他的速度呢,还不是一个真正大的问题,因为这一方面有了技术,有了企业这方面应用的思维,这已经不是一个最大的问题。
我今天想是超前一点,并不是说我们非得马上今天就要连结,但是这个连结已经成为很大的问题,哪一个公司,哪一个企业能够在这个方面跨第一步,得到的商业上的回报是会最大的,整个工业我们认为也在朝这个方向努力。用个比喻,我们大家都知道这个故事,盲人摸象,每个盲人摸到的反映都是不一样的,有人认为是一个矛,有人认为是一条蛇,或者一棵树等等。那么大数据的使用已经不是盲人摸象了,很多人亮着眼睛看这个象了,但是这个象已经长大几千倍了,但是即使用眼睛看,但是还是看不清楚,只能看到一个局部。所以这些问题主要的原因,我们还没有充分的运用我们的技术,我们尤其是企业操作的一种游戏规则—来使得不同的数据能够交流。因为人有这样的能力,我们懂得的东西或者我们要懂得一个原理,远远超过我们的感官能够达到,我们很多东西是看不到,听到,闻不到,尝不到的,但是我照样因为我们的理解能力,通过数据的连结我们知道是怎么回事,这个数据可以是一本书,可以是一部电影等等之类。通过这个数据的表达,使得我们知道远远超过我们的感官能够达到这样的境地。
但是要达到同样的能力,在企业上来说就必须有大量的连结,首先是数据的连结,包括哪些方面呢?
第一个数据是很多位数,尤其是很多复杂的现象,我们现在讲的复杂的现象就是消费者,消费者是怎么做决定的,为什么买这个东西,为什么出这么多钱。在美国我们感到很新奇的,为什么有很多人要在苹果出来的第一天排队八个小时,花400美元买一部,在半年以后只要100美元,不需要排队。那么在这种时候呢,如果你要掌握市场的脉搏,始终走在消费者前面,给他们提供最有效的信息以及产品的话,就需要连结,这个连结保证人文、行为、态度以及场景这方面数据的连结。然后我们看到了很多公司以及他们有技术平台,因为他们跟消费者每天都在接触,所以他们的行为接触往往超过了人文以及购买以外消费的信息。还有他们的商品很窄,我们美国安客诚所服务的有几千家公司,我经常去一些大公司跟他们谈,比如说花旗银行,大的人寿保险公司,大的零售商等等。我看到一个现象很有意思,他们看每个消费者是很窄的,他们看到的是用自己的产品品牌去看一个消费者。等八小时之后他们自己是消费者的时候,他们把视野扩大了很多。所以这就是一个问题,如果我们回到消费者本身,而不是局限于消费者这一部分数据的了解,我们的商业行为也会更有效。
第二个这些客户的生活方式和他们的兴趣。每一个东西,每一个客户的行为都有一定的道理,他有一定的背景,这种背景使得驱动他们对某一个产品感兴趣。这一方面我等一会儿再举一个例子。第三个是客户竞争和合作的关联。我们阿里巴巴有很多品牌,消费者去购买东西,或者跟他们媒体发生互动。那么这些方面呢,如果了解的话,我们更能知道我们在消费者心目当中的地位,他们是怎么使用我们的平台以及我们提供的服务,相对于其他一系列的他们的兴趣和其他的品牌的影响。第四个就是媒体。媒体现在是越来越多,那么这对消费者绝对有利的。出现什么现象呢?由于这些媒体的使用,首先是实现了营销者,公司对消费者能够接触、能够宣传他们的品牌以及产品,但第二部分是消费者可以使用媒体来更多的了解不同的公司不同的产品,他们价格、性能、体验方面的区别。
第三个方面更多的消费者是跟消费者自己直接联系,他们大家互相能够谈体验、谈对商品的反映,而且远远超过他们认识的人的这些团体的限制。所以使得很多媒体在消费这个阶段上已经完全连结在一起,但是公司与公司的数据连结并没有实现。最后一个就是社交的群体。社交的群体使得每一个个人不再是一个个人,但是我们的数据库里面,包括我们的分析的手段,分析的一些模型的这种结构,还是往往停留在这样一个假设,这个假设就是每一个个人,他就是一个个人,他今天的购买和另外一个个人的购买,可以分开对待,可以不同的用数据来表达,现在我们还没有发现一个公司把个人与个人的关系,以及个人与消费行为进行有效的联系,所以就形成了盲人摸象的问题。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09