京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据行业2016的变与不变
据《中国科学报》报道,“这两年大数据的风头明显盖过了云计算,这不是好事。”近日,华为IT产品线大数据解决方案规划总监徐兴海在2015中国大数据技术大会上如是说。他认为,云计算已过了炒作期,在公有云的带动下实现了规模化落地,“已经开始赚钱了”;而在去年,大数据的发展还在泡沫的破灭中,今年大数据已开始有走入应用的“苗头”,“而不仅仅是炒作”。
除了从“炒作”到走向“泡沫的幻灭”,备受瞩目的大数据在2015年还经历了哪些变化?又将如何迈入2016年?几个月后,由中国计算机协会(CCF)大数据专家委员会编撰的第三版关于大数据的白皮书将发布,CCF大数据专家委员会副秘书长潘柱延却“提前泄密”,他分析了大数据行业的几个关键词:民生、多样性和融合性、政策拉动、大数据生态。
十大趋势不容忽视
据潘柱延介绍,去年的中国计算机学会(CCF)大数据专家委列出了2016年大数据产业技术发展的十大趋势,而这些趋势可以解释上面提到的关键词。
“可视化技术推动大数据平民化被专家选为了第一大趋势,这是非常有意思的结论,工作组也感到很意外。”潘柱延解释,可视化作为技术形态能排到第一,其实背后隐藏着大数据的平民化,普通老百姓和常规的决策者能够更好地理解大数据的效果和价值。
大数据将引导多学科融合。不仅是计算机领域的科学家,数学等其他领域的科学家也将参与到大数据的前沿研究中。
大数据的安全和隐私也受到了持续关注。对大数据的威胁和对大数据所产生的副作用,以及大数据发展中的障碍会逐渐成为大数据领域的关注点。潘柱延指出,虽然现在并没有针对大数据攻击的大规模报道,但是安全和隐私方面的隐忧已令大家担忧,这也是阻碍大数据发展的问题之一。
还有许多新热点将持续融入大数据的模式中,形成更加平衡的路径。而且,大数据将在民生领域重点应用,提升社会治理的效果。“和民生相关的,如智慧城市、应急、反恐等都会是发展重点,专家组认为这样的领域可能实现爆发性的发展。”潘柱延说。
去年9月5日,国务院印发了《促进大数据
发展行动纲要》,并指出:将在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系。
CCF大数据专家组认为,该纲要将对大数据的发展起到推动性的作用,成为大数据产业快速发展的催化剂和政策标杆,也将推动地方政府出台类似的配套政策。潘柱延指出:“除了学术、技术、商业的推动外,政策的扶持会产生很大作用,大数据相关的基础设施建设和大数据创业公司在双创政策的推动下,两个驱动力会快速带动大数据的发展。”
在学术技术研究上,深度分析会继续成为推动大数据智能应用的代表之一。美剧《疑犯追踪》中曾展示了大数据的最终极应用——人工智能体几乎主宰人类生死的场景。在该大数据会议上,IBM的专家也展示了2011年曾挑战人类智力竞赛并获得冠军的超级电脑系统Watson。潘柱延认为,在人工智能领域,涉及与人的相关能力延伸,比如,决策、预测、精准推介等都将继续是大数据技术和学术研究的重要应用关注点。
数据权属与数据主权将得到进一步关注,
所有权属和主权的利益冲突和争夺都是来自数据资源化、数据价值化。不仅如此,大数据的应用领域还将从“老三样”迈进到“新三样”,即从互联网、金融、健康这三个增长点转换成城市、企业和工业数据这三大新增长点。
谈到人才和技术的生态方向,CCF大数据专家组预测,开源将持续成为大数据发展的主导性的技术方向和技术平台,测评则会以良币驱逐劣币的方式引导优秀的大数据技术发展,而各种各样的创业创新大赛也会成为人才和技术生态完善的一个重要标准和驱动力。
大数据之变
根据2013年发布的大数据白皮书显示,十大关注点在于:数据的资源化,大数据的隐私问题突出,大数据与云计算等深度融合,基于大数据智能的出现,大数据分析的革命性方法,大数据安全,数据科学兴起,数据共享联盟,大数据新职业和更大的数据。
而2014年的十大关注点是:大数据从概念走向现实,大数据架构的多样化模式并存,大数据的安全和隐私,大数据的分析与可视化,大数据产业成为战略性产业,数据商品化
与数据共享联盟化,基于大数据的推荐与预测流行,深度学习与大数据智能成为支撑,数据科学的兴起与大数据生态环境逐步完善。
基于此,潘柱延分析,从2013年到2014年,大数据从概念走向了价值。而从2014年到2015年,大数据出现了几个明显的变化点,如跨接融合、基础互换和基础突破等亟待解决的问题,从2015年到2016年,大数据最重要的变化则是民生、多样、政策和生态。
4年来,大数据受到关注的应用领域包括互联网、电子商务、金融和健康医疗等,最新的关注领域则是城市化、智慧城市、舆情分析、社会安全等。
据CCF大数据专家组预测,2016年与城市、互联网交易和企业相关的三部分数据可能会取得突破性进展,未来一年的资本投入将对该趋势有所印证。
潘柱延透露,今年的大数据白皮书中重点讨论的是大数据开放共享。
在调研中,CCF大数据专家组邀请了100多位专家讲述2016年的大数据计划以及对数据流转的态度。调研结果显示,业内专家都希望能自己收集数据,并利用收集的数据进行数据服务,希望能买到“数据机”,而专家和其所在的机构计划卖“数据机”的却非常少。
潘柱延指出,数据流转整体处在需求大于供给的状态,尤其是数据国际交换和卖数据。“希望通过政府开放共享,拉动数据交流和交换。政策性是大数据发展的重要指标,不可否认,大数据本身具有概念性,有泡沫存在,但是不能因为啤酒上有泡沫而放弃底下香浓的啤酒。”他强调。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16