京公网安备 11010802034615号
经营许可证编号:京B2-20210330
为什么说大数据一定会从ABC里最先掉队
人工智能(AI),大数据(big data)和云计算(cloud computing)三大技术被认为是当今互联网争夺的关键点。而三大技术中中争议最多的在于大数据技术,被夸大的效果和局限性的应用,很可能会让大数据成为ABC三大技术中最先掉队的一个。
ABC的格局
2010年,工业和信息化部与国家发改委联合发布《关于做好云计算服务创新发展试点示范工作的通知》,云计算元年开启。
2013年,阿里巴巴副总裁徐子沛提出该年当属中国大数据元年,而这一观点也得到了业界的普遍认同。
人工智能元年?没有人知道什么时候会到来,但是总有一天会爆发。
云计算技术从一点孤星闪烁,到如今万家灯火通明的局面。云计算产业的拉动已经造就了多个大型互联网企业的再次爆发,强如软件巨头微软也已经在近几年全力转型云计算并且大获成功,Azure也让这家称霸互联网超20年的巨头绽放了第二春。而即便是没有入局云计算的企业,也多为云计算技术的受益者。可以说云计算的力量在如今已经达到了鼎盛,而且未来依然有发展的空间。
![]()
发展人工智能几乎成为互联网行业的口号
人工智能技术一直被认为是离现实颇远的一种,但是2016年,谷歌用一盘棋把世人惊醒,原来悄然发展的AI智慧程度已经达到了如此的境界。从监督学习到自主学习,人工智能的发展就像坐了火箭一样不断攀升,能够涉足的领域也日益增多,而更可怕的还在于,人工智能现如今的状态远谈不上成熟,未来第一大技术送给人工智能相信不会有太多人质疑。
相比之下,大数据就面临了一个很尴尬的局面。起步虽说比云计算略迟,但好在发展够迅猛,在去年大数据风头正劲,阿里云方面提出2016年是万亿大数据产业元年,各类大数据处理平台、处理技术纷纷呈现,大数据产业在各个行业应用,乍看之下并不存在任何问题。
但大数据的发展虽然足够强悍,却远不能与AI和云计算相提并论。就像BAT三巨头中,百度虽强,可与阿里腾讯毕竟不是同一等级的体量。
大数据的欢乐soon
大数据产业的爆发速度可谓极快。从2013年进入我国到现如今的万亿产业,这一技术用短短的几年迅速抢占热点并且发展成为全行业所关注的焦点,不可谓不成功。而大数据的成功有其必然性,也有时势造英雄的运气。
![]()
大数据:先有云算后有天
大数据的成功与云计算发展后计算力的提升有直接关系。大数据的第一特点就是大,大数据的大通常会被人误解,于是小学生统计苏轼诗词短短几十万字都敢称为“大数据”实在是贬低了这一技术。“大”的特点是要大到用常规手段无法统计的程度,而常规手段无法统计就需要借助云的力量,计算力的提升的大数据进行的基础保障。
帮助数据变废为宝。大数据直接解决的一个问题就是企业的废弃数据问题。在大数据技术出现前,数据的重要性就已经引发了企业的重视,但问题在于,数据分拣和处理技术不足,企业空有数据却不能转化为生产力和收益点,而数据存储成本又高,只能遗弃。大数据成果解决了这一点难题,帮助企业把自己原有的金子擦去灰尘,绽放光彩。
![]()
顺风顺水的大数据遇到了好时机
大数据遇到了开放的市场。这一点或许普通用户很难意识到,但相比之下,中国的市场是全球最有活力的市场,也是最大度的市场。我国的市场复杂程度较高,因此往往能够予以新生技术发展的土壤,大数据在我国的迅速开展也得到了政策和技术的多层面的保障。
政策支持提供通道,云计算帮助提供基础,市场需求提供养料,大数据迅速发展达到巅峰。但是,这并不代表大数据的问题可以就此掩盖,相反,越是不被注意,大数据的隐患就越根深蒂固。
君有疾,不治恐深
扁鹊见蔡桓公的时候,一在腠理,二在肌肤,三在肠胃,都有法可医,但蔡桓公不听,直到神仙难救,是有救而不自救。而大数据的问题显然没有那么深,但却同属于越拖越差的顽疾。
大数据的顽疾一:大数据价值被夸大,投入产出比远不能让人满意。这一点顽疾是典型的人祸,换句话说就是有小部分的大数据企业正在败坏大数据的行业形象。大数据的应用确实可以达到提升企业业务效率和决策效率的目标,但远没有部分企业所吹嘘的那么神。
![]()
不仅摇不到钱,还得砸钱
大数据并不是摇钱树,绝不能秒用变现。相反,大数据是一个变现较慢的技术,从大数据部署应用到影响决策,从决策部署实施到产生效果,整个流程周期很长而且变现效果未必就能尽如人意。高昂的投入,被吹的天花乱坠的预期,和平庸甚至让人失望的结果,三者的夹击下企业能对大数据还剩下多少好感呢?
大数据的顽疾二:对药不对症,低端难生存。大数据产业虽然现如今在进行全面化、全产业的推广,但不可忽视的一点就是,大数据对低端产业并不友好。这一点并不难理解,低端产业数据量本身并不大,分析需求低,分析结果对企业的指导意义也小,因此需求度本就低。
![]()
有钱自己搞,没钱我不要
而高端产业中,真正有需求的企业往往可以自成一脉。比如像阿里、腾讯此类巨头企业,数据量过大,数据需求旺盛,因此不太可能选择不同的大数据产品——一为数据安全,二为长期打算。所以,此类企业自己研发大数据技术或产品会更合适,而这种各自为战的局面就可能造成大数据行业最不愿看到的情况,孤岛化产生。
采据东篱下,悠然见难关
大数据的顽疾三:数据采集难度被低估。这种问题是来自两个层次的,第一层面是技术提供方的低估,许多大数据产业的技术提供方都会侧重于大数据的处理、管理和分析等流程,而在数据采集方面只是进行简单的埋点等代码方式解决。这种方法在互联网行业可以一用,但在大数据推广到其他行业之后就会受到严重的限制。
![]()
数据采集:要钱还是要全
在非互联网行业数据采集时,企业往往会选择易采集的数据,并非全面数据,这就是第二层问题,采集成本的限制。要收集多角度全面化的数据就需要增加采集投入,而不增加就会造成数据分析准确性降低,增加则可能让效益成本比更低,两难的境地让大数据颇为尴尬。
大数据的顽疾四:隐私与安全成枷锁。如果只是采集到数据就能一次性的使用,那么成本的投入也属于可接受范围。但问题在于,大数据的流动性较强,数据变化频繁,普通的数据一般三个月就会面临失效和滞后,而重新采集时则会面临全新的局面。
![]()
盼我疯魔,还盼我孑孓不独活
同时,大数据在频繁和多次采集时隐私问题就成为无法避免的一环。强如谷歌搜素采集用户数据也需要用户同意才能进行,但不同意的用户怎么统计呢?这一大类用户会不会成为导致“幸存者偏差”的一环呢?但如果强行获取这部分用户的数据,这些数据的所有权是谁的呢?
而且,一旦涉及用户隐私直接相关的就是安全问题。企业采集到用户的数据建立大数据库,大数据库价值斐然是黑客攻击的焦点,而一旦数据失窃,到时候受伤最直接的却并不是企业而是用户,又有哪家企业能够确保自家的数据库绝对不会泄露数据呢?
大数据恐不再“大”
大数据的这些顽疾存在已经有一定的时间了,但真正付诸解决,获得成效的颇为少见。随着大数据在不同行业的深入开展,大数据的问题还会持续揭露,届时是否能够提供能解决问题的方案将有可能关乎大数据的未来发展。
![]()
DT时代数据依然为先,但可能不大了
在DT时代,数据量依然在爆炸呈指数型增长,每个用户、每个企业都能产生大量的数据,而数据的处理手段也在不断的“傻瓜”化,便捷化。每个人都能应用数据,都能处理数据,这一点相信一定会在技术的研发中实现,但问题在于,这些数据真的对每个人都有价值吗?
一个企业可能花费数十万把整个公司近十年的数据拿来分析一遍,然后交给决策者,决策者看后欣然决定:“没错,我们下一步要做人工智能!人工智能一定能赚钱!”但是,这些决策真的需要大数据来提供帮助吗?即使这家企业确实做了人工智能,也实现了增长,那么功劳真的应该归给大数据吗?这家公司能称之为数据驱动型增长企业吗?
大数据目前面临的就是一个这样的问题,砸出去的是真金白银,收回来的却只是却只是一群可能有用的信息。信息是无价的,观点是无价的,但这个无价也可能真的就是一文不值。
![]()
大块头才要大数据
大数据在未来依然会强大,依然会是政府、公共事业、交通、航天等各种大型机构的必需品。可是对于普通企业以及普通员工来讲,一张Excel表格也许就能解决问题,那么何必非要动用“核武”级别的大数据处理技术呢?在未来,数据依然重要无比,企业产生数据,分析数据,运用数据,可数据处理将会趋向常规化,而不会像大数据一样轰轰烈烈。
未来,ABC之中的Big Data可能会卸下Big的头冠,给Data让位。数据才是大数据的核心,也是发展的核心,但这一切还需要考虑企业能否接受,和是否需要。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02