京公网安备 11010802034615号
经营许可证编号:京B2-20210330
百度“工业革命”思维:大数据再造互联网
腾讯创始人马化腾就用“互联网+”来概括互联网行业的未来机会,即互联将向更多的传统行业渗透,并使传统行业脱胎换骨;百度创始人李彦宏则认为互联网未来有一个趋势,除了马化腾论及的“互联网+”之外,另一个趋势是互联网本身也在被技术改变,此前一波是移动技术,未来主要是云计算与大数据。
“互联网+”是已经发生的事情。李彦宏说:“接下来发生的事是技术改变互联网。”
4月24日,百度第四届技术开放日在北京举行,会议的主题是“大数据引擎驱动未来”。百度在当日宣布发布大数据引擎,并将这一大数据引擎向外界开放,为其提供大数据存储、分析及挖掘的技术能力。这是全球首个开放大数据引擎。
百度大数据引擎的意义是什么?至少包括两个方面的意思:一是利用新技术,特别是移动、云计算、大数据技术改造互联网;二是打造一个开放平台,把“互联网+”的思想引入更多行业。
数据开放平台
百度大数据引擎包含三层开放平台,分别是开放云、数据工厂、百度大脑。
百度开放云解决的是数据存储和计算瓶颈,这是由百度低能耗数据中心和分布式运算架构等技术来解决;在数据工厂平台,百度提供了“大数据挖掘机”把数据关联起来,并从中挖掘出它的价值;百度大脑建立在百度深度学习和大规模机器学习基础之上,现在已经可以模拟两、三岁婴儿的智力水平。
随着移动设备的普及,现在的人们已经随时随地都在产生数据,无论是某个PC网站上购物,搜索某条新闻,或是在手机玩某一个游戏,这些行为都会留下数据。
这种趋势还会继续。未来产生的数据,除了电脑、手机外,还有移动传感器、可穿戴设备、智能电视、车载电子设备,也包括了手机定位器、手机照相机等。这些设备会产生更加丰富的数据,使未来成为一个“大数据”时代。
在设备方面,百度开始进行尝试投资,包括智能手环、智能手机等产品。这些硬件产品多与第三方公司合作,百度出技术、出钱,甚至出人。百度的目的就是把百度的技术,包括搜索、地图等植入到这些硬件产品中,获得更多数据。
李彦宏把这一策略称为“baidu inside”,类似PC时代的“wintel inside”,不同的是,“baidu inside”是免费的,目的在于数据,“wintel inside”很昂贵,在PC时代,微软与英特尔攫取整个产业大部分利润。
百度高级副总裁王劲说,现在这个时代是一个数据大爆炸的年代,每个人,每个机构都要适应这一变化。
百度大数据引擎已经推出了一些十分好玩的服务:今年春节期间,百度和央视一起做了“百度迁徙活动”,利用基于百度地图LBS开放平台,根据每天多达70亿次的定位信息,在地图上直观显示春运期间人们怎样运动。
另外例子是百度大脑与语音识别技术相结合的应用:可以把海量的婴儿声音上传到大数据中心提取特征,年轻父母可以录下婴儿哭声上网比对,就知道孩子因为什么哭,是饿了,还是想撒撒娇,让没有带孩子经验的父母得到帮助。
百度工业革命
上述好玩的应用只是百度自己在百度大数据引擎上开发出来的应用;百度未来要把百度大数据引擎开放给更多行业的更多企业,让他们插上互联网的翅膀。
王劲举了一个医疗行业的例子,现在已经有很多可穿戴设备能够24小时每天监控健康状况,记录血压、心跳、睡眠状况、运动状况,检测汗液、血液,分析用户的身体情况,并且24小时不间断地把检测数据上传到大数据中心。
王劲说:如果把这些数据跟医院关联,这些数据将产生极大的价值。
王劲以心脏病做例子解释:每年有几百万人得了心脏病,百度大数据中心具有很好的计算能力,可以从几百万患者的24小时监控数据里头找到它的共性,我们提前两天给人发预警,如果你再这样下去就有可能得心脏病,由医院给人群发出警告,由于预防的代价远远低于治疗的代价,我们有可能把治的成本转换成预防的成本,提高了人们对疾病预防的能力,也能极大改变医患之间关系。
另一个可以改变的行业是保险行业:保险公司希望降低赔付率,在预防的模式下就可以降低赔付率,就有可能打造一个多方共赢新的医疗模式。
百度大数据引擎另一技术是以图搜图的技术:用手机拍一张某人现在的照片,就能在网上把这个人过去在网上所有的照片都找出来。
李彦宏认为:未来数据会无处不在,无论做什么事情都离不开大数据,百度开放自己的大数据核心能力,将更好地帮助传统行业挖掘数据价值,加快传统行业转型升级,进而发挥出对整体社会经济的革命性影响。
李彦宏表示,“海量数据存储、关联、分析是大数据时代的关键,是挑战更是机遇。”百度推出大数据引擎,旨在帮助各行业应对挑战,推动社会大数据、行业大数据的价值挖掘进程,帮助各行业发现并抓住新机会。
并不是每个公司都有存储、关联、分析大数据的能力,百度大数据引擎就是给这些公司提供存储、关联、分析大数据的能力,提供大数据基础设施。
李彦宏说,互联网发展已有二十年,这二十年就是各行各业被互联网冲击的二十年,最先受到冲击的是媒体,然后是零售业,旅游,刚刚开始的是金融业。
每一次涅槃,也是一次重生。李彦宏认为,未来会有更多行业被卷入,而且被卷入的速度越来越快,是一个加速发展的过程,产生一场新的工业革命。
百度本身是一个互联网公司,但却同样需要拥抱互联网:百度搜索引擎抓住的是互联网巅覆媒体的潮流,百度需要变化,迎接下一波潮流。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21