京公网安备 11010802034615号
经营许可证编号:京B2-20210330
七牛总裁吕桂华谈“互联网+”大潮中的大数据机会与挑战
面对信息化潮流,只有积极抢占制高点,才能获得发展先机。世界正在迈入大数据时代,这个时代蕴藏着前所未有的机遇,我们可以选择抓住机遇,也可以选择成为这个时代的看客。那么,这个时代究竟发生了什么?2015全球云计算大会上,七牛总裁吕桂华为大家分析了数据为传统企业带来的变化,以及这些变化背后的机遇与挑战。
他从银行和支付宝的竞争关系谈起,由于用户可以决策是把钱存在银行还是存到支付宝,所以他认为支付宝难以均衡很多银行在做的业务。此外,支付宝的芝麻信用分成为用户申请签证的依据,而银行则很难开拓该业务,因为银行没有足够的信息去评估用户的信用体系,但支付宝则可以通过分析海量用户消费数据及行为数据,对用户进行信用评估。这就是数据支撑的作用。
以数据为中心的世界
互联网时代的世界是以数据为中心的世界。这些数据由人类与设备、与互联网的交互产生。随着技术的向前发展,人们的交互方式将越来越倾向于自己最喜欢的最自然的交流方式。曾经,信息获取的主要途径来自报纸等刊物,即人看报纸的这个交互方式是他们认为最舒适的获取信息的方式。事实上,对于人类的交互来讲,讲话是最舒适的,将要说的话打成一行字其实是人妥协于电脑的一种沟通方式。
此外,技术的发展还将使得系统会越来越聪明。例如,传统报纸由编辑驱动,编辑的眼里没有个体,只有群体。如上海市民最喜欢看什么新闻,他们可能的阅读顺序是怎样的,因此,报纸的排版是面向上海市民整个群体的喜好。然而,今天的用户更爱使用像“今日头条”这样的产品观看新闻,今日头条将根据读者的使用习惯和阅读喜好持续调整所推荐的新闻内容,如果用户对时装感兴趣,就为他推荐时装相关信息,如果用户从事IT工作,则可能会获得IT讯息或者股市讯息的推荐,并且信息的推送也会越来越精准,这是系统越来越聪明的含义。事实上,现在的系统并未达到真正的“聪明”,它只是为信息进行了分类,对用户不感兴趣的内容进行标记,持续收集用户的喜好。事实上,这个过程可以用更聪明的方式,例如通过用户看哪些新闻的时间最长判断他对哪些新闻感兴趣。因此,让“系统越来越聪明”的事情还有很大的发展空间。
实体店的挑战与机遇
如今,人们购买东西时总会越来越依赖于电子商务,那么,实体店该如何利用自身优势,借助大数据打一场翻身仗呢?如果没有实体店,只有电子商务,世界就变成了一个纯虚拟的世界。因此,实体店铺也有其存在的意义,如App Store实体店铺提供的体验难以被虚拟体验所取代。鞋子合不合脚,自己穿了才知道。用户在消费时更希望触摸到真实的商品,而非商品的图片。淘宝、京东上展示的商品细节再多也只能通过图片和文字,更何况这些图片通常会被美化。所以,对用户而言,实体店的意义在于能够触摸和试用商品,这种体验难以被虚拟的体验所取代。那么商户开实体店而非网店的好处是什么?电子商务可以通过大数据分析研究客户喜好,实体店同样有自己的优势,即能与消费者面对面接触。在实体店里,商家可以直接感知客户的情绪和趋向性,对于进行贴身说服和收集最真实的反馈均有着重要的意义。
这里再举个例子,七牛客户海康有着一款可进行客流统计的摄像头产品,能帮助用户记录每天的客流量。在一些简单的购物场景中,一个顾客如果到某个店里三四次但仍未购买任何产品,那这个客户非常值得挖掘。潜在客户的信息虽然在线上很容易收集到,但线下却能收集最原始的信息,如这个客户到底在徘徊什么,他在哪个区域停留时间最长,停留时在看什么产品,这些数据信息能否从视频里提取出来?这才是大数据真正的意义。因此,大数据的含义不是分析数据,关键是要知道从哪里收集大数据,从而采集提取数据的价值。
数据时代的逆向思维
技术人员在做IT系统或者互联网系统的时侯,通常会涉及到关键字的过滤或图片识别。在做关键字过滤时总会采用最简单的匹配模式,即软件部门列出许多关键字,然后相关技术人员要将所列出的所有关键字过滤掉。这种通过自然的判断,再进行执行的思维是正向思维的方式。然而,谷歌则是采用逆向思维的方式。谷歌在做关键字的过滤时,并不知道用户在用哪些关键字做非法的事情,也不知道哪些关键词需要被过滤。因此,它首先会创建很少的较确定的关键字列表,然后用它去观测用户使用这些关键字以后对结果的操作,由于用户搜索该关键字并不一定就能搜到色情内容,那么,用了这个明确的色情关键字以后点击最多的是什么?他们判断,用户停留最长的结果肯定是相关的内容,从而得出一大批跟他们目标相吻合的结果,然后逆向地发现,其他人是通过另外的关键字达到这个结果,再自动的生成一个需要关注的关键字列表。因此,在逆向思维里,有了数据以后可以逆向的分析事件结果来推导用户的目的性。
这里举出另一个逆向思维的例子,关于智能手环,它主要收集人的健康状态,事实上,它不仅能分析个体的健康状态,它还能分析群体事件。例如通过数据分析发现,某个地区的人群本应该在睡觉,但当收集的数据突然出现了运动量的最高峰时,表示该地区一定发生了重大事件,这个思考点却不是常人能想到的。从大数据角度来讲,数据的逆向思维可以做很多大家原来没有想过的事情。
“互联网+”时代的大数据挑战
“互联网+”和“+互联网”是互联网时代的两个概念,“互联网+”意味着互联网能够颠覆所有的传统产业,而“+互联网”则是指传统产业加上互联网后,互联网企业无法对其进行颠覆。这两种观念到底谁会活到最后?传统产业认为自己关系国计民生是不可能被颠覆的,互联网行业却在用事实证明它已经颠覆了很多产业。而吕桂华认为,过程不重要,关键是目标在哪里。
传统的数据分析主要通过收集信息、简单的数据处理、数据的存储、分发展示,然后对这些数据进行挖掘以创造更好的用户体验,获得商业的成功。存储环节的数据包括数据本身及用户的行为数据,例如拍摄一张照片上传其实有两份数据,一份是照片本身,另一份是谁在什么时候上传了这张照片的日志数据。不论传统产业还是互联网产业,都需要自我更新,最终要实现以数据驱动的商业模型。
七牛的解决方案
七牛的定位是做最开放、最完备的数据服务提供商。因此,七牛能在整个数据服务流程上帮助客户,让他们用较低的成本进行大数据分析的尝试。那么,我们该如何正确理解“互联网+”呢?吕桂华有着他自己的见解,他认为“互联网+”其实指以互联网为工具武装的新业务思维。如上述中谷歌关键字过滤的案例,有数据的搜索方式和没有数据的搜索方式有着本质上的区别。如果还是用以前的方式做事情,就无需大数据,因为人脑没有办法用大数据的方式思考问题和处理问题。所在在数据分析领域,需要有新的思维出现。
数据的重要性已勿庸置疑,因此,各企业应该尽可能多地积累原始数据,再去思考如何从中挖掘价值。数据的收集并不只是为了更精致地展示,获取价值的关键是要知道用怎样使用它。不同的行业需要思考的层面不一样,需要颠覆的东西也不一样,但颠覆的方式需要用数据的思维去思考,而不仅仅是把线下的业务平移到线上。
“互联网+”时代的第一步是要收集更多的数据,将数据存储起来的同时再去思考到底要如何使用这些数据创造自己的核心竞争力。数据价值,始于存储,因此,七牛希望帮助大家迈出“互联网+”时代的第一步:开始收集数据!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01