京公网安备 11010802034615号
经营许可证编号:京B2-20210330
百度“工业革命”思维:大数据再造互联网
腾讯创始人马化腾就用“互联网+”来概括互联网行业的未来机会,即互联将向更多的传统行业渗透,并使传统行业脱胎换骨;百度创始人李彦宏则认为互联网未来有一个趋势,除了马化腾论及的“互联网+”之外,另一个趋势是互联网本身也在被技术改变,此前一波是移动技术,未来主要是云计算与大数据。
“互联网+”是已经发生的事情。李彦宏说:“接下来发生的事是技术改变互联网。”
4月24日,百度第四届技术开放日在北京举行,会议的主题是“大数据引擎驱动未来”。百度在当日宣布发布大数据引擎,并将这一大数据引擎向外界开放,为其提供大数据存储、分析及挖掘的技术能力。这是全球首个开放大数据引擎。
百度大数据引擎的意义是什么?至少包括两个方面的意思:一是利用新技术,特别是移动、云计算、大数据技术改造互联网;二是打造一个开放平台,把“互联网+”的思想引入更多行业。
数据开放平台
百度大数据引擎包含三层开放平台,分别是开放云、数据工厂、百度大脑。
百度开放云解决的是数据存储和计算瓶颈,这是由百度低能耗数据中心和分布式运算架构等技术来解决;在数据工厂平台,百度提供了“大数据挖掘机”把数据关联起来,并从中挖掘出它的价值;百度大脑建立在百度深度学习和大规模机器学习基础之上,现在已经可以模拟两、三岁婴儿的智力水平。
随着移动设备的普及,现在的人们已经随时随地都在产生数据,无论是某个PC网站上购物,搜索某条新闻,或是在手机玩某一个游戏,这些行为都会留下数据。
这种趋势还会继续。未来产生的数据,除了电脑、手机外,还有移动传感器、可穿戴设备、智能电视、车载电子设备,也包括了手机定位器、手机照相机等。这些设备会产生更加丰富的数据,使未来成为一个“大数据”时代。
在设备方面,百度开始进行尝试投资,包括智能手环、智能手机等产品。这些硬件产品多与第三方公司合作,百度出技术、出钱,甚至出人。百度的目的就是把百度的技术,包括搜索、地图等植入到这些硬件产品中,获得更多数据。
李彦宏把这一策略称为“baidu inside”,类似PC时代的“wintel inside”,不同的是,“baidu inside”是免费的,目的在于数据,“wintel inside”很昂贵,在PC时代,微软与英特尔攫取整个产业大部分利润。
百度高级副总裁王劲说,现在这个时代是一个数据大爆炸的年代,每个人,每个机构都要适应这一变化。
百度大数据引擎已经推出了一些十分好玩的服务:今年春节期间,百度和央视一起做了“百度迁徙活动”,利用基于百度地图LBS开放平台,根据每天多达70亿次的定位信息,在地图上直观显示春运期间人们怎样运动。
另外例子是百度大脑与语音识别技术相结合的应用:可以把海量的婴儿声音上传到大数据中心提取特征,年轻父母可以录下婴儿哭声上网比对,就知道孩子因为什么哭,是饿了,还是想撒撒娇,让没有带孩子经验的父母得到帮助。
百度工业革命
上述好玩的应用只是百度自己在百度大数据引擎上开发出来的应用;百度未来要把百度大数据引擎开放给更多行业的更多企业,让他们插上互联网的翅膀。
王劲举了一个医疗行业的例子,现在已经有很多可穿戴设备能够24小时每天监控健康状况,记录血压、心跳、睡眠状况、运动状况,检测汗液、血液,分析用户的身体情况,并且24小时不间断地把检测数据上传到大数据中心。
王劲说:如果把这些数据跟医院关联,这些数据将产生极大的价值。
王劲以心脏病做例子解释:每年有几百万人得了心脏病,百度大数据中心具有很好的计算能力,可以从几百万患者的24小时监控数据里头找到它的共性,我们提前两天给人发预警,如果你再这样下去就有可能得心脏病,由医院给人群发出警告,由于预防的代价远远低于治疗的代价,我们有可能把治的成本转换成预防的成本,提高了人们对疾病预防的能力,也能极大改变医患之间关系。
另一个可以改变的行业是保险行业:保险公司希望降低赔付率,在预防的模式下就可以降低赔付率,就有可能打造一个多方共赢新的医疗模式。
百度大数据引擎另一技术是以图搜图的技术:用手机拍一张某人现在的照片,就能在网上把这个人过去在网上所有的照片都找出来。
李彦宏认为:未来数据会无处不在,无论做什么事情都离不开大数据,百度开放自己的大数据核心能力,将更好地帮助传统行业挖掘数据价值,加快传统行业转型升级,进而发挥出对整体社会经济的革命性影响。
李彦宏表示,“海量数据存储、关联、分析是大数据时代的关键,是挑战更是机遇。”百度推出大数据引擎,旨在帮助各行业应对挑战,推动社会大数据、行业大数据的价值挖掘进程,帮助各行业发现并抓住新机会。
并不是每个公司都有存储、关联、分析大数据的能力,百度大数据引擎就是给这些公司提供存储、关联、分析大数据的能力,提供大数据基础设施。
李彦宏说,互联网发展已有二十年,这二十年就是各行各业被互联网冲击的二十年,最先受到冲击的是媒体,然后是零售业,旅游,刚刚开始的是金融业。
每一次涅槃,也是一次重生。李彦宏认为,未来会有更多行业被卷入,而且被卷入的速度越来越快,是一个加速发展的过程,产生一场新的工业革命。
百度本身是一个互联网公司,但却同样需要拥抱互联网:百度搜索引擎抓住的是互联网巅覆媒体的潮流,百度需要变化,迎接下一波潮流。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20