京公网安备 11010802034615号
经营许可证编号:京B2-20210330
拥抱大数据:“数”中自有黄金屋
新的石油”、“类似货币或黄金的新型经济资产”、“未来的自然资源”……
今天,当人们在评价种类广泛、数量庞大、产生和更新速度惊人的大数据时,几乎没有人会吝啬这些极富有渲染性甚至有些耸人听闻的话语。伴随着大数据在各行各业的探索之路的启程,其蕴含的巨大价值所显露出的“冰山一角”就已然拥有足以令世人惊叹的力量。

大数据究竟价值几何?
“当前,数据就是生产资料,对大数据的合理共享和利用,就会创造出巨大的财富。”中国工程院院士邬贺铨在接受《人民邮电》报记者采访时如是说。正因为大数据有着公认的“生产资料”的属性,因此其创造财富的空间,几乎是不受任何限制的,其触角可以延伸至各行各业。
从宏观经济到微观经济,从工业到农业,从制造业到服务业,大数据就如同埋藏在沙漠中的金子一样,正在散发出迷人的光芒。
正如邬贺铨所说:“大数据技术可以运用到各行各业,引发新的产业变革,带动新的产业发展。”来自美国研究机构的统计数据也有力地证明了这一点:大数据能够为美国医疗服务业每年带来3000亿美元的价值,为欧洲的公共管理每年带来2500亿欧元的价值,帮助美国零售业提升60%的净利润,帮助美国制造业降低50%的产品开发和组装成本。
谁率先把握住了大数据的机遇,谁就拥有了创造新的财富的可能,拥有了在激烈的市场竞争中傲视群雄的可能。
因为通过对海量数据的分析,可以发现行业的运行规律、市场的偏好与机会等这些最为宝贵的信息,从而让企业决策变得更加有的放矢。以一瓶价格并不贵、看似不起眼的矿泉水为例,基于对一线销售数据的实时分析与更新进行的经营战略和业务策略调整,居然能够带来销售额从20亿元到百亿元的提升,这正是发生在农夫山泉身上的真实案例。类似的案例越来越多,与此同时,大数据的价值也在各行各业中显露出来。现在,几乎无人会质疑大数据的价值,如何获取价值,则成为人们当前关注的焦点。
如何从沙漠中淘到黄金?
尽管大数据有着巨大的价值,但面对广阔的数字沙漠,如何才能发现埋藏于其中星星点点的黄金呢?
“今天的数据是泛滥的,低密度、杂乱无章、海量的大数据本身,并没有什么太多的价值,只有对大数据的挖掘和处理,才能产生价值。”北京航空航天大学校长、中科院院士怀进鹏向《人民邮电》报记者抛出了如是观点,而这正代表了时下业界的主流思潮。从大数据“不仅如此多,而且变化也如此快”的现状出发,“怎么才能挖掘出有价值的东西”,就成为淘金的必由之路了。对此,怀进鹏认为,必须依靠技术、科学的手段,例如寻找到最优的算法和最简单的算法。
事实上,大数据的兴起,与技术的进步几乎是相伴而生的。正如中国联通信息化事业部副总经理耿向东在接受记者采访时再三强调的那样:“过去,对数据的处理成本比较高,因此当人们在考虑到整体拥有成本这一巨大代价时,就会放弃对数据的处理;现在,不仅数据处理的手段变得丰富起来,而且成本也得到了降低,从而令人们能够方便、规模地应用大数据。”正是因为计算、存储等技术的飞速发展和成本的降低以及软硬件一体机等创新产品的出现,促使过去数据挖掘的两大难题迎刃而解,即存在着无法处理的数据和处理成本过高问题,最终让大数据实现了今天的价值化。
值得注意的是,应对数据挖掘的挑战,将围绕数据价值化的全过程。邬贺铨表示,从数据收集、数据存储到数据处理和结果的可视化呈现这四个环节,大数据技术的运用都面临着挑战。与此同时,一个全新的职业——数据科学家也正在诞生,而《哈佛商业评论》甚至称其为21世纪“最性感”的工作。
谁来保卫我们的“财富”?
与大数据创造的财富相伴的是人们自然而然产生的对于安全的渴望。因为缺少安全保证的财富,并不是真正地“抓”在了手中。可以说,安全是大数据不能回避而且在应用之初就必须给出解决方案的课题。
“没有坏数据,只有对数据的不合理使用。”微软研究及策略部门主管克瑞格·蒙迪用简单的一句话道出了大数据安全的核心所在。今天,当谁都可以利用数据挖掘工具获取、分析数据时,如同“皇冠上明珠”的大数据就面临着谁都可以触摸的危险。在大数据时代,如何避免数据被窃取和不合理使用?答案同样是依靠技术进步。例如,世界经济论坛在2013年2月即提出要通过高端科技来保护隐私,将安全策略的重心从管理转移到对数据的限制使用上来。
确保数据的合理使用,离不开技术和制度的“双管齐下”。例如,世界经济论坛就提出所有对于数据的使用都应该登记,同时对于那些违反规定滥用数据的人要采取处罚措施。而耿向东也表示,中国联通目前正在从技术和制度两方面入手确保数据的安全,例如对用户信息进行加密、为信息传输提供通道保护等。
不容忽视的是,对于“财富”的保护,反过来也会催生出新的商机。大数据正在重构信息安全市场,而那些能够率先切入这场变革的安全厂商,无疑会为未来抢占新的制高点奠定一个好的基础。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21