京公网安备 11010802034615号
经营许可证编号:京B2-20210330
近年来不断热议的大数据,已经不仅仅是一个IT领域的未来发展趋势问题了,而是整个人类社会迈向更加智能、高效的标志。然而,大数据和任何一个科学技术一样,它的发展并不能离开社会道德的约束,更不能背离IT技术发展的初衷,在某种程度上我们可以说,大数据不仅是个技术问题、商业问题,其实更是一个“哲学问题”。
哲学问题,归根结底都会讲究一个“度”,尤其是这种作为技术手段帮助人类挖掘数据、实现更高效智能化分析和业务决策的大数据来说,更需要有一个“度”来约束。也就是说,任何事物或者工具的应用,都应该有一个“边界”,观念和时尚中的“跨界”并不能“放之四海而皆准”。过于透明会让人无所适从和不合情理。
这类例子数不胜数,比如某个女孩平日经常关注如何瘦身、丰胸,当她与朋友去商场购物的时候,总被丰胸瘦身产品的促销人员围住做宣扬……亦或者出于好奇而在网上搜索“棺材”,于是接下来的一个月内,打开的微博、网站、电商等网站都会给他展示、推荐相关产品,让其连续一个月“被看”骨灰盒。
1针对“被推荐”广告,网友小陈发微博吐槽
当然,这些并不是大数据本身的问题,而是大数据参与者——“人”的问题。但正是由于参与的主体 ,包括数据的采集、传输、存储、处理、分析等一系列环节中的人及其所使用的平台和技术,会因为 “人”的问题会使得结果会不易控制或者变得泛滥。
基于此,本文将会从安全隐私、商业价值和数据真伪多个角度对大数据问题进行剖析,为大家揭示一个“大数据给卖萌空间,智慧给情感腾地儿”的道理。
2大数据需要拒绝“数据暴政”
大数据的威力从兴起之初就可以得到体现。难道不是么?在云计算还刚刚兴起还未被人们完全接纳、采用的时候,大数据就已经被推到了历史舞台的面前。
在一些公司、实验室和政府机构,“数据”被捧为21世纪新型“石油”或“黄金”。因为大数据能够给人们带来更多市场机会和商业价值,而实现这些价值所需要的技术手段,其本身也会给大数据服务商、软件和硬件等基础设施提供商带来巨大利益。
在众多利益面前,往往容易产生一种“冲动行为”,也就是为实现利益而产生的驱动力。在这种背景下,大数据时代也难免会带来一些“数据暴政”类似的副作用。
高逼格当卖萌遇上大数据,情感面临智慧大考
如果有人在“脸谱”上表示“喜欢”某款牛仔裤,当他下次进入该店铺时,就可能收到店主给他发送的同品牌牛仔裤的打折信息。看起来,这对零售商和消费者都有好处,但主张保护数据隐私的人却认为,“大数据”理念其实与“专制独裁”没有区别。
在线期刊《科学报道》近期一项研究显示,每个人有自己的行动模式,95%的人可能被识别。普林斯顿计算机科学家阿尔温德·纳拉亚南在其博客上说,可供分析的数据越多,就越不可能保持“匿名”,识别一个人只要33个字节的信息量。
数据分析能预测你的孩子在学校表现如何,他将来适合怎样的工作,谁有多大几率犯罪或得癌症,电视台和唱片公司能根据预测迎合观众或听众的口味……但在这个一切都计算好的世界里,创意、灵感和惊喜在哪里?互联网哲学家叶夫根尼·莫罗佐夫对许多“大数据”应用程序背后的意识形态提出尖锐批评,警告即将发生“数据暴政”。他提出,那些“大数据”应用程序应当接受独立审计人定期审查,以防权力滥用。
3大数据需要时刻“见缝插针”
大数据能够为人熟知、接纳,根本上是因为它能帮助创造广阔的商业价值。当然,并不仅仅是商业价值,也能给科研、学术、技术发明和天文探索、自然地理等等,都可以带来更高的生产力。
在商业领域的价值呈现,这点非常明显,也无需低估这股市场“冲动”的力量。
通过对大数据的采集处理和分析,可以帮助人们做出更快更准确的业务决策,通过大数据的形式可以建立智能化的平台,实行个性化的营销行为,对消费者进行具体的精准的分析。
从大数据业务特征来看,数据爆炸增长,结构类型复杂,用户行为丰富,Web社群关系复杂。需求分析方面利用大数据分析提升用户体验,增加用户黏性。具体应用方面是社交网络广告精准投放。
在提升企业信息管理能力方面,经过大数据时代用户行为模式的分析,可以做到最有价值的信息进行归档保存,精简合并任务、信息即服务、丰富数据内容、信息追踪机制、公司治理过程,还有面向大数据的企业管理方面,可以提升公司的治理效果。大数据的价值还可以改进企业商业决策,传统做法是结构化、可分析,逻辑性。新的路径是提高了创造性和整体思维能力,以及提高用户的知觉。
这种无处不在、受商业利益驱动的“见缝插针”,其实也更需要在科研、公益等领域获得同等对待。比如智能城市、物联网、学术研究以及人类面临的人口问题、环境问题、能源问题,等等。
高逼格当卖萌遇上大数据,情感面临智慧大考
大数据时代下的智慧城市
智慧城市要体现出人类社会对现代城市和运营管理新的科技发展的水平,智慧,它必然来自于对大数据充分分析和利用,大数据源于非结构数据的猛增包括互联网的发展,使得数量级不断的提高。因此如何对数据进行分析和利用,促进人类智慧运用管理城市,正是大数据面临的挑战和机遇。智慧城市必然催生大数据运营行业的发展,包括大数据的采集、呈现力等等。未来几年智慧城市产生预期发展效果,必然会出现非常重要的围绕大数据运营和管理新的行业和龙头企业。
不过,这些公共利益领域的大数据应用,势必也会不断升温,不过相比商业领域会稍微滞后一点。而对于互联网等新兴IT领域,大数据将会成为主要应用平台。
4大数据需要“去伪存真”
大数据面前,恍若“智慧大师”一般,会让很多人类的情感变得没有了神秘感。各种“卖萌”、情绪和感性,在大数据面前,也会变得透明甚至几分滑稽。不过,这些都不是根本问题,最值的关心的是,大数据的“数据”的来源是否真实可靠?……
可以想象,如果监控探头采集到的数据都是过时的(被人为侵入系统篡改时间)或者人为伪造采集到的数据,那么这些海量数据收集起来并对其进行分析处理的最后结果,将不仅不利于做出正确决策帮助提升效率,相反,还将会给现有和未来的趋势发展带来严重的误判,并最终造成海量资源的浪费。
高逼格当卖萌遇上大数据,情感面临智慧大考
飓风“桑迪”袭击美国
除了数据本身是否为真之外,还存在数据来源是否适配需要分析的结构模型。比如,如果我们在Twitter上分析飓风“桑迪”的相关数据,在2012年10月 27日到11月1日期间, 约有2000万条推文。有人研究了与飓风“桑迪”相关的Twitter和Foursquare的数据。发现了一些预期中的结果(如在“桑迪”来的前夜, 人们去超市购物量激增),但是也发现了一些预料外的结果(比如在“桑迪”过后的一天人们的夜生活开始增加)。
然而, 这些数据并不能反映问题的全貌。 关于“桑迪”的推文的一大部分来自于曼哈顿地区。 这一点可以理解, 因为曼哈顿地区的智能手机和Twitter使用率很高。 不过, 这样的数据会给人们一个错觉, 那就是曼哈顿是这次飓风灾难的中心。 事实上, 来自那些受灾更加严重地区比如说Breezy Point, Coney岛和 Rockway的推文少的可怜。而由于电力中断,来自那些受灾最严重地区的推文几乎没有。 事实上, 对推文的分析,并不能反映那些曼哈顿之外的地区的真实情况。我们可以把这种问题成为“信号故障”,也就是说,数据本来应该真实地反映社会的整体情况, 而由于数字鸿沟,来自有些特定的群体的信号没有被接收到。
综上,从之前介绍的商业价值、安全隐私和去伪存真三大方面,我们不难看出,大数据由于去发展之迅猛、规模之大,使得它以及挣脱了传统IT技术应用的范畴,而更多了被赋予哲学理念的色彩。可以想象,失去哲学思考的“大数据”,会犹如失去理性的人类扩张一样,不仅破坏资源更会破坏人类社会自身的平衡。而这,恰恰是本文所要传达的主旨。
大数据并不是技术,通过用户使用的平台和技术问题的分析与解决,从安全隐私、商业价值和数据真伪多个角度对大数据问题进行剖析。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28