京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据和未来国际政治
在2013年刚开始热议“大数据”这个观念的人们,会发现自己不知不觉已落伍过时。2014年的人们顾不上再空谈其概念和意义,他们蜂拥到大数据的各个富矿当中,埋头于各种开发应用。据业内人士预测,大数据技术很快会出现在社会各个领域。
从数据本身来讲,大数据的3个V(volume,velocity and variety/数据量大,输入和处理速度快,数据多样性)都是呈指数级发展的,翘首向上的曲线图明白无误地告诉人们,大数据的下一个数量级(无论叫什么)也将很快到来。一篇名为《2020年的数字宇宙》的研究报告计算出,从2005年到2020年,“数字宇宙”的规模将增加300倍之多,从130EB增加到40ZB,也就是40万亿GB,约为地球上所有海滩上的沙粒数量的57倍。
从古至今,海边沙子、天上星星,一直都是“不可胜数”的同义词,而在大数据时代的今天,它们竟成了不在话下的“小数据”。

大数据技术很快会出现在社会各个领域
伴随数据爆炸式发展,数据处理技术也飞快发展,目前还属于新奇玩意的数据批处理和存储技术,转眼就成了通用的计算基础设施,成了企业数据架构的核心组件。这意味着,目前还掌握在数据科学家手中的专业,将很快成为一般技能,几年之内,人们运用MapReduce和Hadoop等大数据工具,也许就像当年接受MS Office时的情况一样。
再看看资本方面。根据业界权威Gartner发布的统计,被大数据技术所驱动的IT支出,也呈现出成倍增长的势头,到2016年,全球将达到550亿美元,比2011年翻一番。
到了这个时候,再怀疑新技术革命是不是新一轮忽悠已没有意义,无论是资本驱动,还是技术驱动,总之,现实正紧追忽悠,忽悠正变成现实,两者合一了。
Google公司每天要处理超过24 PB(2的50次方字节)数据,Facebook每天收录30亿次点击和上传,Twitter上每天有超过4亿条微博发布。这些领跑大数据时代的公司,当然不是在自娱自乐,它们都极为认真地看待它们每日每时收集到的海量数据,把数据当作其核心资产。虽然巨头们还不急于推出太过惊世骇俗的应用,但人们明白,由于信息构成了世界的本质,一旦大数据开始不受约束地显示其力量,世界的各个领域都将被颠覆。
在目前这个阶段,大数据对个人的颠覆已轻松完成。曾几何时还被视为个人隐私坚固盾牌的三大措施——告知与许可、模糊化、匿名化,在大数据时代都已名存实亡。随着数据量越来越大,数据来源越来越多,个人毫无抵抗地变成了透明体。若一个小小的智能电表都有能力凭它所收集的用电数据推测你的生活方式和起居规律,那又何况你的手机、电脑和银行卡?又何况街上无处不在的摄像头?一家英国报纸曾说过,如果《一九八四》的作者乔治?奥威尔活到现在,他会发现在他的伦敦公寓60米范围内,起码有30多架摄像头在监视着他的一举一动。世界早已进入了“超级老大哥”时代,个人的自由意志在丧失,个人的生存价值在消散。
大数据对团体的颠覆也轻而易举。一个广为人知的案例是:为了揭示日本相扑赛事中非法操纵比赛的情况,芝加哥大学的经济学家们使用了11年中超过64000场比赛的记录数据,果真发现了消极比赛的发生规律,让业内的潜规则大白于天下。
这还属于很初级的应用。在目前的PB级时代,大数据技术刚刚成熟,还只是小试牛刀,从巨量的历史数据中随意抽取一部分相关关系,建立几个简单的算法模型,预测一下流感的传播、机票的打折、电影的票房、交通的状况…显得很无害,很友善,很为人民服务。但每年数百亿美元所养育的大数据技术当然不只是为了小小的“练习题”,十年之内,大数据的规模就将从PB级跨入EB级(2的60次方字节),再跨入ZB级(2的70次方字节)。坐拥历史上空前规模的数据量和空前发达的数据处理技术,“超级老大哥”们还会满足于小规模、小范围的颠覆吗?
如果能够轻而易举破解日本相扑业内部不为人知的“行规”,那么,从理论上讲,任何一个团体和组织的内部“行规”、隐秘知识、核心机密,都有可能通过海量的公开数据进行破解。而且,面对呼啸而来的大数据海浪,组织的规模和内部的信息封锁都不再构成障碍,安保能力的增长只是算术级的,数据能力的增长却是指数级的,在这场竞赛中,开始可能道高一尺魔高一丈,后来就会道高两尺魔高八丈,可以肯定,大数据全胜!
问题来了。主权国家这个人类社会的利维坦,不过就是个较大规模的组织。十年之内,今天看起来还巍然屹立坚不可摧的国家,也终将面临大数据浪潮的涤荡。就像破解日本相扑赛事,很快就会有人宣布,他利用大数据技术精准地破解了某个国家的特殊行为模式。
希腊的债务危机是如何形成的?日本的右倾化会走多远?伊朗核计划的真实状况如何?“薄荷四国”的提法是噱头还是现实?……这类题目的话语权将很快从政治分析师转到数据分析师手中,前者凭借经验和逻辑所建立起来分析框架,将被后者的海量数据冲得稀里哗啦。
在新加坡国立大学马凯硕教授近日发表的一篇文章中,作者开篇即提出问题:“中国强硬的新姿态背后传达出怎样的信息?是一个强有力的政府在宣告中国从今将表现得像一个真正的大国;还是一个弱势政府屈服于国内民族主义风潮?真相如何,外界不得而知,但我们能够推断,如果中国继续坚持强硬立场,其在亚太地区获取多少利益,便要在全球层面付出多少代价。这是中国未来不得不面对的新困境。”
在大数据时代,人们很快就不这样说话了。针对一国政府与国内民族主义风潮的互动关系,甚至会有现成的模型,随时通过大数据进行检验。至于一国在地区层面与全球层面的利益交换,也可以轻易数据化,得出基于量化指标的结论。
十年之内,各国政府都会设有应对大数据国际政治的专门机构。中国政府会发布大数据报告,揭示日本的军国主义历史演变轨迹;日本也会针锋相对,发布关于中国军力增长的大数据分析,甚至预测出中国建立海外军事基地的时间。随着各国政府从大数据分析中获得的新知识、新观察、新洞见越来越多,国际政治的整体局面必将大为改观。
但国家本身却不是这场数据革命的主导者,而是被动的接受者和追随者。“除了上帝,其他人必须用数据说话”,据说这是硅谷经理人的信仰,那些每日每时都在收集着“富可敌国”的数据资源的巨头企业,其实也早已拥有了“强可敌国”的大数据力量,在所有人都必须用数据说话的时代,它们就是新的上帝。是它们在引领变革,在将硅谷的信仰的行为规范推向全世界。如此看来,Google,Facebook,Twitter等公司在目前这个阶段的相对低调和隐忍,更显得其状不祥,大有风暴前短暂平静的模样。
而一个基本事实是,最大的大数据公司都在美国,用国家来衡量,美国早已是囊括了大数据资源最多的国家。如果大数据终将导致权力的重新分配,美国将再次占据优势。这是大数据时代国际政治格局的另一个维度,也不得不正视。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22