京公网安备 11010802034615号
经营许可证编号:京B2-20210330
开放与安全 大数据的“尴尬”博弈
手握大数据,你能做什么?
消费者,可以通过售后服务和投诉率等指标货比三家;商家,可以借助信息的公开透明和谐相处、良性竞争;投资者,可以分析数据准确找到自己想投资的项目……
有人说,数据就是生产力,在信息社会,它将成为核心资源;有人说,虽然它还没有被列入企业的资产负债表,但只是一个时间问题……
大数据,已然成为时下最火热的IT行业热搜词,随着数据仓库、数据安全、数据分析、数据挖掘等围绕大数据商业价值的被利用,其逐渐成为行业人士争相追捧的利润焦点。
只是,自古“忠孝两难全”,凡事皆难两全其美。当央视315晚会大力度曝光Cookie采集用户信息时,当人们因个人隐私被泄露而只能一声叹息时,“风光无限”的大数据遭遇了当头棒喝。福音还是灾难?一夜间,关于大数据的讨论多了些许忧心的成分,如何挖掘和使用数据?企业的道德底线瞬间被推上了审判的至高点……
大数据开放才是硬道理
“大数据时代,是三个和尚在一起才有水喝。”对于这一形容,阿里集团数据委员会的会长车品觉非常认同,在他看来,大数据行业本身非常考验技术和商业的同时,也需要很多其他的东西结合起来之后才能用在数据上, 亦即利用数据拿到更多数据,互惠互利。
为了更好地理解这一概念,在阿里媒体开放日上,车品觉和我们分享了一个典型的故事。
一个海员,因为意外要把他派到一个地方去收集一些航海工具。当时,他发现这个地方有很多航海日志,可以提炼出不少数据化的航海背景,于是,他收集这些东西放在航海地图上,以帮助将来出海的人做一些决策,而航海的人根据此地图行动后也必须要收集一些数据继续完善,不断反馈和纠正,在实践中提炼数据的敏捷性,这本诞生于100年前的航海地图就是我们今天追寻的大数据,它具有数据体量巨大、数据类型繁多、商业价值高和处理速度快等特点。
收集数据、应用数据,然后出现质量问题,层层反馈回去以建立更清楚的数据源。对于大数据而言,开放似乎才是硬道理;对于很多企业来说,大数据管理其实是补10年前管理理念上的课。眼下,移动互联网与社交网络的兴起更是将其带上了新的征程,但车品觉却表现出了谨慎保守的态度。
“孤立的部分不能构成整体,但处理开放最大的难题就是数据安全,开放是硬道理但安全也是重要的保障,在安全还没搞清楚之前,开放还需要等待。”在大数据行业践行多年的车品觉再三强调现在谈数据的开放还为时尚早。毕竟,数据越大,问题越大,数据安全问题亦自云计算概念普及之时已被频繁提上议程。
个人隐私遭泄露:数据开放的另一头是安全
网购时,包括家庭住址、电话等个人信息被商家一览无余之时也被不法企业廉价贩卖;安装手机APP,通话记录、短信记录、通讯录成了隐私信息泄露的三个高危地带……于是,各种陌生、欺诈电话应接不暇;个性生活、消费习惯更是被相关利益方了如指掌。小米科技CEO雷军更是发出“手机丢了,比电脑丢了还恐怖”的感慨,如是说,越来越开放的大数据已失去了重心?如何守住正义的最后这道防线成了商家必修的课题。
对于淘宝和阿里系,车品觉介绍称,从内部的情况来讲,个人很重要的信息我们称之为敏感信息,从敏感信息来讲,从收藏库到仓库是隐蔽的,你是工程师或者在内部开过店有你个人的隐私,内部安全把敏感数据隐蔽,不能让一般人看见这个数据,有些我们称之为机密性的数据就更严重一点,在仓库里面都看不见这些数据,这是隐秘性的。从应用来讲,要应用这个数据需要遵守PRD原则,经过内部的评审,看有没有侵犯到个人隐私,所以,从内部来讲对个人隐私方面还是相对保护比较多。
事实上,当前大数据面前有三座大山,一是数据质量作为底线:如果原材料不可靠,将无法加以利用;第二,平衡数据安全与开放,开放是硬道理,但开放最大的难题是数据安全。第三,落实数据化运营,只有当大量的员工懂数据,用数据来决策业务,才能说明这家公司开始启动数据化运营。
不可否认,数据开放本身会产生力量,适当的开放也会产生更多的想法,但如车品觉所言,开放不一定是获取数据,可能是创新想法的交换,这比获取数据更重要。
当前,挖掘用户的行为习惯和喜好、 帮企业做内部数据挖掘或优化、帮企业更精准找到用户,降低营销成本,提高企业销售率,增加利润……可以看出,虽然大数据目前在国内还处于初级阶段,但是商业价值已显现出来,诞生了新的商业模式的同时亦仿佛站在金矿上。
如何让它有可参考性?“伴有主观情绪在里面的数据需要清楚的告诉别人主观判断在哪里,比如我们看一些访谈,它会说,这个访谈是经过调查两千人后得到的结果,这种就是参考数据。”车品觉表示。
值得一提的是,无论如何,在隐私泄露这件事情上,消费者是需要被保护的弱势群体,商业也好,企业也罢,需要在开放与安全中把握好一个“度”,可以说,这是一个良心的判断。
阿里大数据还在路上
让数据获取、使用、分享、协同、连接、组合变得超级简单,这是大数据时代背景下我们的终极理想。只是,需要努力的是,我们暂未找到一个很好的盈利模式,包括走在前面的阿里。
“今天很多大数据公司还在投资,我们还看不清他的赢利点到底在哪里,最简单的是用数据去做一些数据产品,比如以前的数据魔方,或者今天的阿里金融,就是用数据生产一套新的东西出来,我相信这是今天比较容易能看见的。”车品觉说。
此前,阿里集团董事局主席马云提出了“平台、金融、数据”三步走的战略,继阿里集团架构调整、组建小微金融服务集团后,再次传出阿里金融让银行紧张的说法。
据介绍,阿里金融是针对中小企业在这个时代的融资需求应运而生,这个方案贯彻了透明、开放、责任与分享,它的第一职责不是帮助金融机构,帮助客户、帮助无数淘宝卖家才是阿里金融的责任所在。
“金融行业不紧张,我们的小微企业就很紧张,所以我觉得假如阿里巴巴集团能够让现有金融体系紧张一下,也是互联网企业对社会进步的重要贡献。”马云说。在他看来,任何一个领导者对企业成功的定义都不是挑战了谁,而是创造了谁,否则终有一天会倒下。
事实上,从酝酿到曝光,在不为人知的背后,阿里金融走了很多年,在数据安全的基础上,怎么体现出数据的价值?开放似乎也还只是一个构想。
“我们今天所走的路是很新的路,参照系的东西并不多,从国外的公司来讲,有我们这个数据量的公司也并不多,我们确实是要小心地一步一步去走这条路,我们都很相信,它会有非常大的价值,但是这个价值将来到底怎么体现出来,就要看后来这条路,我也没办法今天去判断它绝对的价值是怎么产生的,每一个做数据的人肯定都非常相信它的价值,包括我自己在内。”关于大数据的未来,车品觉总结道。
大数据的话题虽然很热,但真正的脚步离我们还很远;而阿里大数据,亦尚在路上。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27