
启明星辰副总裁潘柱廷:2016大数据技术发展趋势解读
这是大数据专家委编纂的第三年的版本,前两年都是一个比较全面的大数据介绍和论述,今年没有做这样全面的介绍和论述。围绕国务院发布的纲要,对纲要进行解读,就其中的热点问题做了比较深入全面的阐述。今年白皮书中主要集中在两个方面,一个是关于大数据开放共享的多方位解读——数据交换、交易、交流、流通等问题。从内外现状、风险与对策,和一些探索做了一些陈述。第二个对工业大数据做了比较全面的分析,关于工业大数据的,对工业的变革,中国制造2025,工业大数据发展历程等等一些相关的产业和技术问题。这是今年大数据白皮书的两个主要的论点,围绕这两个方面。当然这个白皮书还包括即将发布的大数据的趋势和相关的一些大数据企业背景资料,这个白皮书今天已经算是发布,在征求大家意见之后过几个月出版,先介绍一下大数据白皮书的情况。
对2016年大数据发展展望
这个展望大数据专家委这是做的第四次,从之前2012年底做的2013年的展望,即会做下一年的预测,这个预测是调研方式就是大数据专家委一百多位委员内部进行这样的一个观点征集、汇总,最后进行投票和去年一样,同时邀请中国大数据产业联盟的会员参与到最后的投票环节,今年总共投票的专家是116位,从这116位专家投票中形成了下述的结果。
根据今年大数据专家委列出的2016大数据产业技术发展的十大趋势,从这里面我们简单解读为他出现了这样四个重点的关键字,一个是民生相关的应用,因为应用很多,应用驱动大数据,因此民生相关的大数据可能会得到更快的发展,第二就是多样性和融合性,不管是技术、产业等等各方面会出现多样融合的状况,另外第三个就是政策拉动,第四总是呼吁各个层面出现多样的生态,简单对这十各方面稍微做一个解释。
第一,可视化技术。作为汇总整理的时候这也是给了工作组一个很大的意外,做了这样一个解读,我们认为可视化作为技术形态能够排到第一,其实背后隐藏着大数据的贫民化。普通老百姓和常规的决策者能够更好的理解大数据的效果和价值,所以能够摆在这么重的位置,不仅仅可视化的形态,也包括可视化的分析,这是排在第一的趋势。
第二,多学科融合。大家对学科的发展非常关注,预测排在第二位是多学科融合,大家认为数据科学的雏形已经出现了,从表现形式来看,很多相关的数据,科学的研究院,专门的实验室,也可以看到这样的学科逐渐的完备,可能会逐渐的出现,当然本身确实也是交叉性的学科,是多学科融合的产物,所以从事大数据研究不仅仅是计算机领域的科学家,也包括数学等等方面的科学家参与到整个大数据前沿的研究中。
第三,大数据的安全和隐私持续受到关注。从现在大数据的发展情况来说,应该说针对大数据的威胁和大数据所产生的副作用,以及大数据发展中的障碍会逐渐成为大数据领域所要关注的点。针对大数据的攻击现在没有大规模的报道,但是隐忧已经令大家担忧。隐私大数据所带来的副作用,原来的隐私我们接受的程度,有了大数据之后隐私接受程度发生了很大的变化。由于大家对大数据的安全等等相关的问题的担忧阻碍我们在大数据的发展上的投入,这也是阻碍大数据发展的问题。
第四,从技术的角度来说,很多新的热点持续入大数据的整个模式中,形成一个更加平衡的路径。这样的趋势大数据专家委认为还会持续下去,从本届大会安排的很多技术论坛的分布大家可以看到这样多样化的趋势。
第五,大数据提升社会治理和民生领域的应用。基于大数据的社会治理成为社会的热点,而且和民生相关,比如说智慧城市、应急、反恐等等,作为国计民生来说,其实国计和民生不是互斥的关系,如果相关的国计和民生有关系,专家认为这样的领域可能会得到爆发性的发展,比如反恐方面,又是和国计和老百姓相关的东西,医疗健康等等这些都是跟老百姓密切相关,同时也是国家大计。
第六,《促进大数据发展行动纲要》驱动产业生态。对各个地方政府可以出台类似配套的这样一些政策会有很大的推动作用,不可否认对大数据的推动。除了学术、技术商业的推动以外,政策的扶持也会产生很大的作用,所以我们认为大数据相关的基础设施建设和大数据创业公司在双创政策的推动下,大数据两个驱动力会快速带动大数据的发展。
第七,学术技术这方面,深度分析推动大数据智能应用。这里面谈到智能尤其强调是涉及到人的相关延伸,比如说决策预测、精准推荐都是被专家委关注的技术和学术的应用点,这里面涉及到人思维的延展,人的能力的延展,这些都会成为大数据分析机器学习,这方面学术技术拉动的方向。
第八,数据权属与数据主权备受关注。所有的权属和主权的利益冲突和争夺都是来自数据资源化、数据价值化。
第九,大数据整个的应用领域的变化,其实这个变化简单认为是老三样和新三样。老的是互联网、金融、健康,新的是城市、企业和工业的数据,新三样会拉动大数据发展的新的增长点。
第十,开源、测评、大赛催生良性人才与技术生态。
其实经过几年的对比,2014年到2015年出现了几个明显的变化点就是跨接融合,一个是基础互换,和基础突破的亟待解决的问题,而在2015年到2016年我们看到重要的变化就是民生多样、政策和生态,这三个在整个趋势中一个明显的现象。大数据专家委也有十项的单项调研,这是大家都会知道的大数据是靠应用驱动的,这四年以来受到关注的应用领域互联网、电子商务、金融和健康医疗,新的是城市化、智慧城市、舆情分析、社会安全等等这些是被关注的新的领域,大数据专家委做了数据关注的预测,2016年的预测是城市相关的数据,技术保持的是互联网交易相关的数据,还有企业相关的数据,这三个数据成为大家关注的,可能会取得突破的数据类型,也成为大家参会嘉宾们可以考虑,未来一年你们研究和资本投入的可行性,是不是和这个趋势有所印证。这是从应用领域和数据类型可以看到整个大数据发展在应用和技术发展上的某种侧重,前面认为的老三样和新三样也是从这样的调研中做出的总结。
在今年大数据白皮书中重点谈的是大数据开放共享,在这里面整个调研中也专门设立了这样一项,一百多位专家明年和他的机构对数据的态度是什么,对数据流转的态度是什么,这是所有的选项,我们会看到确实大家都想自己收集数据,希望能够利用收集的数据进行数据服务,希望能够买到数据机,专家和他们的机构会准备卖数据机的机构非常少。我们看到整个数据流转上是需求大于供给的状态,数据确实是一个奇货可居的情况,尤其是数据国际交换和卖数据,这是专家的选择百分比都是小的个位数,这方面的人非常少,这是看到整个数据流转的形态,我们也希望通过政府开放共享拉动数据交流和交换。政策性是大数据发展的重要的指标,而且不可否认大数据本身具有概念性,我们不否认大数据有它的泡沫,但是不能因为啤酒上面有泡沫放弃底下香浓的啤酒, 专家委针对这样的概念进行调研,也是一个单选项,在下面所谓的现在流行的概念中专家们认为和大数据最相匹配的概念是互联网+、云计算和智慧城市,这是大数据专家委的看法,这三个选项和下面的选项具有数量级大的跳跃。从大数据发展的驱动力我们从去年和今年的对比看到创业企业对大数据的推动力被大大的看好,因为这个选项接近十个,下面两个空是其他的选项跟这三个差距多大,大型互联网和政府机构继续是大数据的推动,专门们非常期待创业公司能够在这个里面起到更多的推动作用,这和大众创业万众创新双创政策有关的推动。
这是一个非常有意思的发展阶段的判断,设置了六个阶段,请大数据专家委的专家对当前中国大数据所处的阶段进行选择,和去年的选择相比,我们看到其实,很明显看到专家们乐观的态度,达到峰值上升乏力和进行变换的选项的选择专家在下降,大家还是看好大数据的发展前景,而且可以看到认为大数据还处在非常初级的阶段和即将快速扩张,现在还没有快速扩张,这两方面的专家加起来超过70%,我们对大数据所能够看到的峰顶,其实我们还没有看到,这是大数据专家委比较多时的共识,势在发展,有多高,我们还不知道,这是非常乐观的看法,在这样的乐观看法上,还有政策的推动下希望给大数据相关产业带来更多更美好的前景,上面是我向大家发布的大数据白皮书和2016年的发展趋势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01