京公网安备 11010802034615号
经营许可证编号:京B2-20210330
李彦宏、张亚勤:解读云端大数据正在改变世界
“除了上帝,任何人都必须用数据说话。”管理学大师爱德华.戴明(Edwards.Deming)早在上世纪中期便提出过这个观点。在互联网的时代,数据更是有通天的能力。近期,杨澜访谈录就云端大数据的价值和未来及其危害等问题,访问了百度创始人李彦宏和CEO张亚勤。
关于云端大数据,李彦宏说到:“尽管现在还是处在大数据的早期,很多数据产生出来是无目的的,是价值很低的,甚至是没有价值的。在未来,数据需要更加有目的的产生,那时大数据放出来的能力,就会非常不同。”今天我们就根据访谈内容总结一下,在这个早期,云端大数据正在改变着世界哪些东西。
准确预测世界杯足球、奥斯卡、高考作文
所谓大数据预测,其实就是通过以往的和现有的量数据分析分析,整合数据特征,根据分析挖掘超大规模的计算能力、数据处理和智能算法,从而预测结果。高考还没开考,大数据已经预测出了作文题,卫生组织还没发话,大数据已经预知到了H1N1的流行趋势,是的,云计算和大数据相当于打开了一个新的人们研究这个世界的一个方式。
像今年的世界杯,微软、谷歌和百度都有人工智能的引擎,预测每场比赛的结果,准确里都是非常高的。在淘汰赛阶段结果更是百分之百。
李彦宏说,百度有个员工曾开发了一个系统,预测奥斯卡,根据奥斯卡历届获奖人员的数据特征、入选演员的评价,入选电影的票房、作品的数据特征、演员和作品的搜索数据特征等等,将这些数据进行挖掘分析,再通过一系列的算法,从而预测奥斯卡获奖名单。最后猜中好几位获奖者。
从因果关系到相关关系
春节和黄金周期间,人口流动巨大,这是因果关系;非典期间,口罩和白醋脱销,这是因果关系。但是尿不湿和苹果有关系吗?谁知道呢?李彦宏举出了以下两个案例说明。
据沃尔玛的数据统计分析得出结果,奶爸们没在买婴儿纸尿裤的同时,必定会捎几瓶啤酒。这是为什么没有人知道,因为没有因果关系;同样在美国飓风期间,超市会将户外急需用品增加到货架,但令人没有想到的是,数据显示此时蛋挞的需求量也随着大幅增加,同样没有原因,但却相关。这就是大数据推算出来相互关联的关系。
智能推送人们想要的新闻、话题和商品
对于智能推送相信每一个网友都是受益者或者是受害者。小编有个最深切的体会,在淘宝上第一次看了很多婴儿的衣服之后,每每打开其他有淘宝广告的网站时,广告推送全部变成了婴儿用品,而这些正好就是我想要的,以往却总是女装或生活用品。这就是阿里将用户的行为习惯通过大数据分析而做出的智能推送。
在如美国的《赫芬顿邮报》不想再使用编辑人工来选择什么样的新闻是头条,而是通过数据分析,有计算机来绝点什么样的新闻才会是大家关注的焦点。对此,李彦宏说到,“对于这一类事情,计算机一定可以做的更好。就像现在百度新闻,你点击了这一条新闻,你往下滑的时候,后面就会出更多相关的新闻。就是说,你上一秒的行为,就会影响你下一秒钟看到什么,这就是大数据的力量。”
改变医疗,在家能把病治好
除了互联网公司,医疗行业可能是让大数据分析最先发扬光大的传统行业之一。医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。因此,医疗行业将和银行、电信、保险等行业一起首先迈入大数据时代。
首先在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。然后对病人的远程监控系统收集数据,并将分析结果反馈给监控设备(查看病人是否正在遵从医嘱),从而确定今后的用药和治疗方案。对于支付更是简单便捷。所以我们可以想象,将来我们是否不用去医院就可以把病治好。
帮助政府规划政策
对于政府来说,大数据不仅能在社会秩序、人文道德上帮助政府,比如春节时,在哪儿加开列车加开航班,高峰时期地铁的如何运转,都是可以使得整个社会的运转效率会有比较明显的提升。
同时在政府规划、总统大选上,一样能够发挥巨大的作用。李彦宏提到奥巴马竞选团队在美国大选时就动用了大数据技术分析。在过去两年的筹备过程中,奥巴马背后的数据分析团队一直在收集、存储和分析选民数据。在第二次大选中,奥巴马竞选阵营的高级助理们决定将参考这一团队所得出的数据分析结果来制定下一步的竞选方案,最终赢得大选。
转变人们的思维
我们总说时代在发展,人类在进步。其实时代发展的每一步,都必定有一个重大的事件。造纸术的发明造就了人类的文明的延续;蒸汽机的问世加快了世界的步伐,也拉进了世界的距离;计算机的诞生让人们从10进制走向2进制,从现实走向虚拟;社交网络、智能手机、甚至阿里巴巴、百度谷歌的存在无一没有改变人们的生活,转变人们的思维。
是的,大数据也将是转变人们思维的下一个神话。在访谈中,杨澜提到,古登堡发明了现代的印刷机,在十年之内,欧洲印出的书,相当于过去八百年的总合。那么大数据概念是什么?李彦宏回答说,在过去两年,我们这个世界产生的信息量,是人类有史以来,人类文明就是这一万年左右产生的这个数据量的总和,这就是大数据时代。当以上的转变变得成熟,变成人们的习惯后。云端的大数据,最终会影响的就是我们的生活方式和思维方式。(文章来源:CDA数据分析师培训官网)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10在结构化数据分析领域,透视分析(Pivot Analysis)是CDA(Certified Data Analyst)数据分析师最常用、最高效的核心实操方法之 ...
2026-02-10在SQL数据库实操中,字段类型的合理设置是保证数据运算、统计准确性的基础。日常开发或数据分析时,我们常会遇到这样的问题:数 ...
2026-02-09在日常办公数据分析中,Excel数据透视表是最常用的高效工具之一——它能快速对海量数据进行分类汇总、分组统计,将杂乱无章的数 ...
2026-02-09表结构数据作为结构化数据的核心载体,其“获取-加工-使用”全流程,是CDA(Certified Data Analyst)数据分析师开展专业工作的 ...
2026-02-09在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06在机器学习建模过程中,特征选择是决定模型性能的关键环节——面对动辄几十、上百个特征的数据(如用户画像的几十项维度、企业经 ...
2026-02-06在CDA(Certified Data Analyst)数据分析师的日常实操中,表格结构数据是贯穿全流程的核心载体,而对表格数据类型的精准识别、 ...
2026-02-06在日常办公数据分析中,我们经常会面对杂乱无章的批量数据——比如员工月度绩效、产品销售数据、客户消费金额、月度运营指标等。 ...
2026-02-05在分类模型(如风控反欺诈、医疗疾病诊断、客户流失预警)的实操落地中,ROC曲线是评估模型区分能力的核心工具,而阈值则是连接 ...
2026-02-05对CDA(Certified Data Analyst)数据分析师而言,数据分析的价值不仅在于挖掘数据背后的规律与洞察,更在于通过专业的报告呈现 ...
2026-02-05在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03